• Thứ Năm, 08/09/2011 10:18 (GMT+7)

    Xử lý tiếng Việt trong CNTT: ngành ngôn ngữ cần vào cuộc

    A.L
    Trong buổi tọa đàm “CNTT và tiếng Việt” diễn ra ngày 7/9/2011 tại Hà Nội, các nhà ngôn ngữ học cũng như các chuyên gia về CNTT đã thảo luận về những tồn tại và các giải pháp ứng dụng CNTT hiệu quả đối với sự phát triển của tiếng Việt, cũng như đưa tiếng Việt chuẩn vào các ứng dụng CNTT.

    Trong Đề án đưa Việt Nam trở thành nước mạnh về CNTT (Đề án tăng tốc) mà Thủ tướng Chính phủ đã ký phê duyệt vào tháng 12/2010, nhiệm vụ thứ 6 về tăng cường năng lực nghiên cứu trong lĩnh vực CNTT-TT, làm chủ và từng bước sáng tạo ra công nghệ cho chế tạo sản phẩm mới đã nhắc đến vấn đề “xử lý tiếng Việt”.

    Cụ thể hơn, đó là nhiệm vụ giải quyết các bài toán về ngôn ngữ học nhằm phục vụ công tác lưu trữ, tìm kiếm, chuẩn hoá dữ liệu, nhận dạng văn bản, tiếng nói, dịch tự động, ngoại giao số... và đương nhiên trong môi trường CNTT cũng phải thực hiện quyền bình đẳng về ngôn ngữ cho cộng đồng các dân tộc thiểu số.

    "Phải làm rõ mối quan hệ giữa CNTT và ngôn ngữ học" (Tiến sĩ Quách Tuấn Ngọc).
    Tuy nhiên, từ đó đến nay, vấn đề xử lý tiếng Việt trong môi trường CNTT vẫn còn quá nhiều thách thức cũng như tồn tại nhiều bất đồng giữa những nhà ngôn ngữ học cũng như các chuyên gia về CNTT, nghĩa là vẫn chưa có một "chuẩn" nào để có thể gắn kết 2 lĩnh vực này.

    Theo Tiến sĩ Quách Tuấn Ngọc, Cục trưởng Cục CNTT - Bộ GDĐT, cần thiết phải xác định lại bản chất của mối quan hệ giữa CNTT và ngôn ngữ học, trong đó ứng dụng CNTT trong vấn đề xử lý tiếng Việt có thể tiếp cận với các vấn đề cụ thể như: chuẩn hóa thuật ngữ CNTT bằng tiếng Việt, quy chuẩn cho việc sắp xếp từ điển theo trật tự chữ cái và trật tự các dấu thanh tiếng Việt để xây dựng các Từ điển điện tử chuẩn…

    Còn theo ông Nguyễn Đức Hoàng, Chánh văn phòng của Hội Trí thức khoa học và công nghệ trẻ Việt Nam, những thực tế đặt ra với vấn đề xử lý tiếng Việt là ngành CNTT và ngành ngôn ngữ học phải có sự phối hợp liên ngành, nghĩa là là ngành CNTT phải đặt lại vấn đề một cách nghiêm túc ngay từ môi trường giáo dục, trong khi đó, ngành ngôn ngữ học phải có định hướng đào tạo, nghiên cứu cho vấn đề ngôn ngữ trong mối tương quan với CNTT.

    Trong khi đó, bàn về việc phát triển của hoạt động dịch máy và các vấn đề liên quan đến bảo vệ tiếng Việt, Tiến sĩ Nguyễn Ái Việt, Viện trưởng Viện CNTT – Đại học Quốc gia Hà Nội, khẳng định dịch máy chính là tương lai của nội dung số. Với doanh thu đạt đến 12,6 tỷ USD trong năm 2010, thị trường dịch thuật toàn cầu đang phát triển rất nhanh, đặc biệt là các công cụ dịch máy. Hiện đã có tới 83% biên dịch viên sử dụng công cụ dịch máy.

    Thị trường dịch thuật trong nước mặc dù chưa phát triển, nhưng tiềm năng rất lớn bởi nhu cầu ngày càng cao do việc chuyển giao công nghệ và mọi sản phẩm điện tử tiêu dùng đều có sự góp mặt của thị trường này. Thách thức đặt ra là việc dịch máy có thể giết chết nghề dịch thuật, cũng như góp phần hủy hoại sự giàu có của tiếng Việt. Do đó, theo Tiến sĩ Việt, quan trọng nhất là phải xây dựng hệ thống thuật ngữ, cũng như phải có quy hoạch để hệ thống dịch máy không làm mất đi bản sắc của tiếng Việt.

    Một lần nữa, thay lời kết, Hội trí thức Khoa học và Công nghệ tiếp tục đề xuất với Bộ GDĐT về việc phải xây dựng chuẩn tiếng Việt trên môi trường CNTT và ấn bản giáo dục, đồng thời nhấn mạnh “nhiệm vụ này chỉ có thể đi đến những kết quả như mong muốn với sự tham gia tích cực của ngành ngôn ngữ học”.