• Thứ Tư, 30/11/2011 12:55 (GMT+7)

    Cần sớm cụ thể hóa nhiệm vụ “Xử lý tiếng Việt”

    “Xử lý tiếng Việt” là vấn đề quan trọng của "Đề án tăng tốc" (*). Tuy nhiên, trong khi chưa cụ thể hoá được các đầu việc cho nhiệm vụ này thì cuộc tranh luận về 4 ký tự F, J, W, Z trong tiếng Việt hiện đại nổ ra và đến nay vẫn chưa đến đầu đến đũa.

    Không phải là chuyện nhỏ
    Do vấn đề vẫn bị "treo" ở đó, nên vẫn cần được tiếp tục thảo luận và phải bàn cho ra được một phép giải phù hợp để thừa nhận sự hiện hiện của F, J, W, Z. Với những người đã tích cực vận động cho định hướng này, mong muốn của họ hẳn không chỉ là “Xử lý tiếng Việt” mà còn phục vụ cho cả tiếng dân tộc thiểu số, công nghệ dịch thuật, ngoại giao số…

    Tuy nhiên, có lẽ cũng tạm phải hài lòng với cụm từ này và nếu phân tích ra thì “Xử lý tiếng Việt” đã bao gồm cả quốc ngữ và ngôn ngữ của cộng đồng các dân tộc thiểu số. Riêng với công nghệ dịch thuật, nếu là bài toán dịch xuôi thì mọi việc khá đơn giản vì chúng ta được thừa hưởng các công cụ phân tích có sẵn với các ngôn ngữ nước ngoài.

    Song nếu quá trình này được tiến hành theo chiều ngược lại thì sẽ là vấn đề vì phải có các công cụ phân tích ngữ pháp, văn phạm tiếng Việt. Vì thế, “Xử lý tiếng Việt” thực chất cũng đã bao hàm cả một phần công nghệ dịch thuật. Vấn đề đặt ra là “Xử lý tiếng Việt” cần được giải thích rõ ràng về những thực tế và phải được hiểu theo nghĩa rộng nói trên.

    Dẫu vậy, nếu mới chỉ hiểu về “Xử lý tiếng Việt” theo nghĩa rộng thì chắc chắn là chưa đủ mà vấn đề lớn hơn là phải làm sao mường tượng được tất cả những gì có thể làm và cần phải làm cho nhiệm vụ này.

    Và cũng cần nói thêm rằng nếu không cải thiện được tiềm thức xã hội vẫn coi CNTT là công việc nội bộ của các chuyên gia tin học thì sẽ rất khó xúc tiến được gì cho “Xử lý tiếng Việt”. Và có lẽ vì thế, cũng phải mừng cho câu chuyện cần thừa nhận F, J, W, Z trong tiếng Việt hiện đại đã tạo được một sự quan tâm lớn của không chỉ hai ngành CNTT và ngôn ngữ học dù rằng chưa có được một kết quả rõ ràng.

    Từ thực tế của những tranh cãi với 4 chữ cái F, J, W, Z, một lãnh đạo cao cấp của Liên hiệp các hội Khoa học & Kỹ thuật Việt Nam (VUSTA) khẳng định: đây không phải là câu chuyện nhỏ và các nhà khoa học của nhiều lĩnh vực cần phải ngồi lại với nhau để giải quyết vấn đề.

    Cũng cần nói thêm rằng, việc xây dựng một tiêu chuẩn chính tả cho tiếng Việt trên môi trường CNTT từng được Bộ Khoa học Công nghệ và Bộ Thông tin Truyền thông đặt vấn đề, song vẫn chưa làm và thậm chí không thể làm, vì đó là vấn đề quá khó để đạt được sự nhất trí. Đến lượt Bộ Giáo dục & Đào tạo thì qua những dư luận bùng lên hồi tháng 8/2011, có lẽ người có ý định đề xuất cũng đành phải tạm quên nó đi. Chính vì thế, một quan chức từng phụ trách CNTT của Bộ Khoa học Công nghệ cho rằng, đến nước này thì VUSTA phải vào cuộc và VUSTA không được quyền thất bại.

    Chính phủ nên đặt hàng các nhà khoa học
    Theo TS Dương Kỳ Đức - Tổng thư ký Hội Ngôn ngữ học Việt Nam, để cụ thể hoá cho tiểu nhiệm vụ “Xử lý tiếng Việt”, ngoài các chuyên gia về CNTT, ngôn ngữ học và dịch thuật thì còn phải có cả sự tham gia của các chuyên gia thuật ngữ chuyên ngành. Rõ ràng, đây là vấn đề của tất cả mọi lĩnh vực chuyên môn vì bất cứ ngành khoa học nào cũng phải xây dựng một bộ thuật ngữ chuyên ngành, và được biết một số hội thành viên của VUSTA trong các ngành như hoá học, xây dựng, y - dược… đã xây dựng được xong những bộ thuật ngữ và từ điển chuyên ngành. Chắc chắn, các chuyên gia từng phụ trách việc này của các hội khoa học chuyên ngành cũng sẽ hết lòng vào cuộc nếu như họ được mời.

    Có thể nói, qua thực tế của việc phải giải quyết những vấn đề phải đặt ra cho tiểu nhiệm vụ “Xử lý tiếng Việt” của Đề án tăng tốc, nếu tất cả các hội khoa học chuyên ngành cùng nhìn vào một cách nghiêm túc thì chắc chắn CNTT không còn là công việc nội bộ của các chuyên gia CNTT như tiềm thức xã hội vẫn quan niệm nhiều năm nay - theo nhận xét mà TS Quách Tuấn Ngọc, Cục trưởng Cục CNTT Bộ Giáo dục & Đào tạo từng đưa ra. Với tinh thần trách nhiệm, khi đã cùng ngồi lại với nhau, hoàn toàn không có ai muốn quá mất thời gian cho công việc này.

    Trong quá trình soạn thảo Đề án tăng tốc, Viện Chiến lược Thông tin & Truyền thông - cơ quan chịu trách nhiệm việc này từng thừa nhận quan điểm “CNTT không chỉ là một ngành khoa học mũi nhọn độc lập, mà mọi lĩnh vực khoa học khác đều cần đến CNTT để làm công cụ phát triển” của GS TSKH Đỗ Trung Tá – Phái viên CNTT của Thủ tướng Chính phủ, là quan điểm xuyên suốt của Đề án. Vì thế, để Đề án tăng tốc có thể triển khai thành công thì tiểu nhiệm vụ “Xử lý tiếng Việt” phải sớm được cụ thể hoá. Không làm được việc đó thì có lẽ mọi nhiệm vụ ứng dụng và phát triển CNTT của mọi lĩnh vực sẽ khó thuận lợi để triển khai.

    Đó cũng là vấn đề hết sức rõ ràng và nghiêm túc để Chính phủ cần “đặt hàng” các nhà khoa học. Một lần nữa xin được nhắc lại quan điểm của GS Ngô Thanh Nhàn - một Việt kiều làm việc trong lĩnh vực xử lý ngôn ngữ: Việc này không thể có công ty tư nhân, cá nhân, nước ngoài hay thị trường tự do nào làm được ngoài Chính phủ.

    --

    (*): Đề án đưa Việt Nam sớm trở thành nước mạnh về CNTT-TT (Đề án tăng tốc) được Thủ tướng Chính phủ ký ban hành vào tháng 9/2010. Đòi hỏi đặt ra cho sự tích hợp với ngôn ngữ học được ghi rõ trong nhiệm vụ thứ 6 về tăng cường năng lực nghiên cứu trong lĩnh vực CNTT-TT, làm chủ và từng bước sáng tạo ra công nghệ cho chế tạo sản phẩm mới.