• Thứ Sáu, 12/08/2011 11:45 (GMT+7)

    Cần có chuẩn tiếng Việt trong môi trường CNTT

    Nguyễn Đức Hoàng
    Với tình trạng lỗi chính tả rất phổ biến trong các kho dữ liệu tiếng Việt, việc khai thác các cơ sở dữ liệu dùng chung chắc chắn sẽ gây mệt mỏi. Có thể giải quyết vấn đề bằng phần mềm, nhưng trước hết cần có chuẩn ngôn ngữ.

    Xung quanh việc Bộ Giáo dục & Đào tạo xúc tiến xây dựng thông tư hướng dẫn về chuẩn tiếng Việt trên môi trường máy tính và sách giáo khoa, đã có rất nhiều ý kiến góp ý, trong đó có những ý kiến chưa trúng vấn đề. Với tư cách là một trong các đơn vị đã tham gia kiến nghị cùng với Hội Cựu Giáo chức Việt Nam và Hội Ngôn ngữ học Việt Nam hồi cuối năm 2009, Hội Trí thức Khoa học & Công nghệ Trẻ Việt Nam mạo muội bàn về câu chuyện này ở khía cạnh liên quan đến CNTT.

    Ứng dụng CNTT bảo vệ chuẩn mực ngôn ngữ
    Trước hết, cần làm rõ rằng việc ban hành một bộ tiêu chuẩn cho tiếng Việt trên môi trường máy tính và sách giáo khoa nếu có thành hiện thực, thì đòi hỏi đầu tiên với bộ tiêu chuẩn đó không gì khác là phải hướng tới mục tiêu bảo vệ chuẩn mực ngôn ngữ của tiếng Việt. Vì thế, dù các chữ cái vốn không sử dụng trong tiếng Việt gồm F, J, W, Z có chính thức hiện diện, thì đó cũng chỉ là những công cụ để soạn thảo ra các chữ cái riêng cùng việc bỏ dấu tiếng Việt chứ hoàn toàn không có chuyện được sử dụng để thay thế cho cách viết thông dụng. Đương nhiên, thứ ngôn ngữ chat mà tuổi teen đang quen dùng để giao tiếp với nhau chắc chắn là không được chấp nhận.

    Lỗi chính tả trên một tờ báo điện tử
    Cũng phải nói thêm rằng, đây là tiêu chuẩn cần thiết phải ban hành cho môi trường máy tính mà sản phẩm được in ra nhờ môi trường này tất yếu phải có sách giáo khoa cùng các giáo trình, tài liệu phục vụ cho giáo dục. Như vậy, thực chất đó chỉ là chuẩn mà sách giáo khoa cùng các giáo trình, tài liệu phải tuân thủ chứ không phải là lại tốn kém công sức và tiền bạc cho việc soạn mới sách giáo khoa để dạy môn tiếng Việt theo những yêu cầu đó.

    Để viết đúng chính tả, nếu viết tay hoặc sử dụng máy chữ thì điều đó phụ thuộc hoàn toàn vào nhận thức của chủ thể soạn thảo. Tuy nhiên, trên môi trường máy tính thì việc này còn được tự động thực hiện bằng phần mềm, dựa trên những chuẩn quy định chính thức. Đó là thực tế dễ dàng nhận thấy với tiếng Anh trong các hệ soạn thảo trên máy tính mà thông dụng là Word của Microsoft. Người dùng nếu chẳng may viết sai từ sẽ được báo lỗi (gợn đỏ), và được gợi ý từ đúng. Thậm chí, câu văn viết sai ngữ pháp thì máy tính cũng thông báo (gợn xanh) và đưa ra phương án chính xác hơn để thay thế.

    Có được kết quả này, cần phải hiểu rằng đó không phải là thành tựu của riêng Microsoft mà thực chất phải từ những kết quả nghiên cứu cùng chuẩn mực ngôn ngữ của tiếng Anh. Đó là những thực tế mà tiếng Việt trên môi trường máy tính cũng phải tiến tới. Ở Việt Nam đã có một số phần mềm như vậy, nhưng chính các tác giả của nó cũng buộc phải chờ mong những chuẩn mực được cơ quan Nhà nước ban hành.

    Sẽ khó tiến hành tiểu nhiệm vụ “xử lý tiếng Việt”
    Có lẽ với phần lớn văn bản hành chính mà nhiều cơ quan nhà nước đang sử dụng và gửi cho các đối tác, tìm ra một vài lỗi chính tả là điều không quá khó. Thậm chí, ở một cơ quan xuất bản quan trọng của ngành giáo dục còn có tình trạng thường để chừa một khoảng trắng trước các dấu chấm, dấu phẩy trên các bản thảo. Đương nhiên, nếu ở vị trí cuối dòng thì rất có thể dấu chấm, dấu phẩy đó sẽ rơi xuống dòng dưới. Ngược lại, cũng có không ít văn bản cứ thế viết tịt vào sau dấu chấm, dấu phẩy, trong khi cần phải cách một khoảng trắng trước khi đến chữ tiếp theo.

    Với một tình trạng chung của các kho dữ liệu tiếng Việt mà lỗi chính tả là chuyện rất phổ biến như kết quả khảo sát của Viện CNTT - ĐHQG Hà Nội và công ty Viegrid công bố vào tháng 6/2010 (Tham khảo bài: CNTT chống lại sự "tàn phá chính tả"), việc khai thác các cơ sở dữ liệu dùng chung chắc chắn là vấn đề mệt mỏi. Rõ ràng là không nên để tình trạng này tiếp diễn và kéo dài.

    Để giúp viết đúng chính tả, phần mềm có thể giải quyết được, nhưng phải căn cứ vào chuẩn. Vì thế, việc có một chuẩn mực chính thức cho tiếng Việt trên môi trường máy tính là điều hết sức cần. Nếu như Bộ Giáo dục & Đào tạo ban hành được chuẩn này thì đó là điều hết sức đáng mừng, trước hết cho chính ngành giáo dục và sau đó cho xã hội.

    Lý ra, việc này cần thực hiện từ lâu rồi chứ không phải chờ đến hôm nay. Chưa xong được khâu này, tiểu nhiệm vụ “xử lý tiếng Việt” trong Đề án đưa Việt Nam sớm trở thành nước mạnh về CNTT-TT chắc chắn là chưa thể nhúc nhích được và làm ảnh hưởng đến những việc khác.

    Nguyễn Đức Hoàng
    Chánh văn phòng Hội Trí thức KH&CN Trẻ Việt Nam