• Thứ Hai, 02/11/2009 07:49 (GMT+7)

    Về công cụ hỗ trợ dịch thuật

    Những trao đổi của ông Lê Vũ Khánh, chuyên gia dịch thuật, về việc xây dựng công cụ dịch thuật trên TGVT B số tháng 9/2009 đã gợi mở một đề tài được các nhà ngôn ngữ học, chuyên gia CNTT... bàn luận sôi nổi. Chúng tôi trích đăng dưới đây một số ý kiến nổi bật

    Phạm Văn Bảy, nguyên Chủ tịch nhiệm kỳ I Hội Tin học TP.HCM:

    Không nên để trễ nữa!

    Ông Phạm Văn Bảy

    Bài trao đổi với ông Lê Vũ Khánh về việc dịch thuật với sự hỗ trợ của CNTT là một vấn đề quan trọng mà ai quan tâm đến hội nhập quốc tế, đến tiếng Anh và tiếng Việt đều rất bức xúc vì chúng ta chưa ý thức khởi đầu vấn đề khá mới này. Ông Lê Vũ Khánh với kinh nghiệm lâu năm, đã là một trong những người đầu tiên khơi mào vấn đề.

    Theo tôi, phải bắt đầu từ những cái cơ bản nhất. Trước hết phải sử dụng đạt chuẩn tiếng Việt trong giao tiếp, trao đổi thông thường, sau đó mới ứng dụng trong môi trường CNTT. Để cải thiện vấn đề này, phải có cơ quan có đủ thẩm quyền và chuyên môn chủ trì, tổ chức tham khảo ý kiến rộng rãi nhiều chuyên gia ngôn ngữ và quần chúng trong và ngoài nước. Từ đó, quy tụ các chuyên gia thuật ngữ, từ điển về CNTT thành một tiểu ban để nghiên cứu đưa ra giải pháp tối ưu thử nghiệm một thời gian, sau đó quyết định thực hiện. Quyết định này bắt buộc tất cả, từ báo chí đến giáo dục... đều phải tuân thủ vì trong ngôn ngữ, nhiều khi chỉ thói quen là quyết định. Chỉ cần thực hiện vài năm, việc sử dụng ngôn ngữ sẽ đi vào chuẩn mực, tạo điều kiện ứng dụng các công cụ CNTT hỗ trợ dịch thuật. Thêm một yếu tố rất cần thiết, theo tôi là phải cùng vì lợi ích chung. Đồng thời, cần chú trọng nghiên cứu phân tích ngữ pháp. Đây là vấn đề khá phức tạp vì ngôn ngữ phải hình thành từ rất lâu theo sự phong phú và đa dạng của tiếng nói.

    Ứng dụng CNTT trong dịch thuật, điều cơ bản là phải xác định tương đối mức độ chính xác của phần mềm (PM) dịch thuật: 80, 90 hay 95% kết quả sẽ khác nhau rất xa. Vì vậy, những công cụ này cũng chỉ mang tính hỗ trợ mà thôi.

    Ý kiến của ông Lê Vũ Khánh là lời nhắc nhở chúng ta về một vấn đề rất lớn và rất đặc thù của CNTT. Không nên để trễ nữa.

    TS Dương Kỳ Đức, Tổng thư ký Hội Ngôn ngữ học (NNH) Việt Nam.

    Nên sử dụng kết quả nghiên cứu của ngành NNH

    Ông Dương Kỳ Đức

    Phải thừa nhận thực tế là ngành NNH ít tham gia vào các hoạt động của ngành CNTT bởi những lý do cả chủ quan lẫn khách quan. Tuy nhiên, trong bối cảnh mà công nghệ dịch thuật bắt đầu bùng nổ thì ngành NNH tất yếu phải chủ động hơn. Các công cụ hỗ trợ dịch thuật từ tiếng nước ngoài sang tiếng Việt dẫu sao vẫn dễ thực hiện. Nhưng để dịch theo chiều ngược lại thì vấn đề sẽ chỉ thực hiện được nếu như các chuyên gia CNTT biết tận dụng các kết quả nghiên cứu của ngành NNH. Để đi đến được sự hội tụ đó, Hội Ngôn ngữ học Việt Nam cũng sẽ tăng cường thêm các mối quan hệ với ngành CNTT và cũng sẵn sàng mở rộng cửa để đón nhận sự tham gia của các chuyên gia tin học, đặc biệt là những người đã và đang thực hiện những sản phẩm liên quan đến NNH. Ngược lại, ngành NNH cũng phải tích cực hơn trong các hoạt động của ngành và mong được xã hội quan tâm.

    Tôi rất hoan nghênh đề xuất của hội Trí thức KH&CN Trẻ Việt Nam cho việc xây dựng chiến lược quốc gia CNTT-TT giai đoạn sau 2010 là phải quan tâm đến đòi hỏi tối thiểu của quốc gia (IT for Minimum) đó chính là về NNH.

    Ông Nguyễn Quan Sơn, Kiến trúc sư trưởng Công ty Cổ phần Truyền thông Tinh Vân:

    Còn nhiều thách thức

    Ông Nguyễn Quan Sơn

    Hiện nay công nghệ dịch tự động chủ yếu đang được phát triển theo hai hướng: Dịch thống kê và kết hợp giữa dịch thống kê với dịch dựa trên luật chuyển đổi. Ưu điểm của dịch thống kê là bản dịch gần với ngôn ngữ tự nhiên, câu dịch có độ trau chuốt cao. Nhược điểm là để bản dịch có chất lượng tốt đòi hỏi phải có tập ngữ liệu rất lớn và đã được xử lý. Phương pháp thống kê có chất lượng dịch không cao với những câu dài, cấu trúc phức tạp. Phương pháp kết hợp khắc phục được những nhược điểm nói trên của phương pháp dịch thống kê, tuy nhiên xây dựng một hệ thống như vậy phức tạp và tốn nhiều công sức hơn.

    Việc xây dựng hệ thống dịch tự động tiếng Việt còn đang gặp nhiều trở ngại do kho ngữ liệu chưa đủ lớn và chất lượng chưa đủ tốt để áp dụng các phương pháp thống kê, các công cụ cơ bản của một hệ thống xử lý ngôn ngữ tiếng Việt như gán nhãn từ, phân tích cú pháp… còn rất hạn chế, chủ yếu mới là các nghiên cứu mang tính thử nghiệm. Công ty Tinh Vân hiện có phát triển công cụ dịch tự động (Anh – Việt) có tên DAVIT(http://dich.xalo.vn), theo hướng kết hợp giữa dịch thống kê và dịch dựa trên luật chuyển đổi. Hướng phát triển kết hợp (thống kê và luật chuyển đổi) của Davit cho phép áp dụng được những thành tựu mới trên thế giới trong lĩnh vực xử lý ngôn ngữ tự nhiên, đồng thời không đòi hỏi phải có sẵn kho ngữ liệu song ngữ lớn như hướng dịch thống kê thuần túy.

    TS Lê Khánh Hùng, nguyên Trưởng phòng Công nghệ Tri thức và PM (Softex), Viện Ứng dụng Công nghệ:

    Công nghệ dịch thuật không thể so với phiên dịch viên

    Ông Lê Khánh Hùng

    Những thử nghiệm đầu tiên của của Softex cho lĩnh vực này đã được thực hiện từ những năm 1990 trên môi trường MS-DOS khi những hệ soạn thảo văn bản tiếng Việt vẫn còn rất sơ khai và phần cứng máy tính thế hệ 286 màn hình đơn sắc. Đến năm 1995, Softex mới thực sự vào cuộc để thực hiện PM dịch EV Tran. Ban đầu, có lúc chính những người trong cuộc cũng phải bật cười khi “computer bus” được PM dịch thành “máy tính đi xe bus”. Tuy nhiên, sự vấp váp ban đầu đó đã giúp các nhà xây dựng PM nổ lực hoàn thiện sản phẩm.

    Công cụ dịch thuật không thể so với các phiên dịch cao cấp, chuyên nghiệp. Hiệu quả của công cụ dịch thuật là dịch một khối lượng tài liệu lớn trong một thời gian ngắn. Tất nhiên, để có được kết quả như mong muốn thì vẫn cần con người xử lý sau khi PM đã xử lý sơ bộ.

    Đầu tư công nghệ dịch thuật tốn kém nhiều công sức và tiền bạc. Tuy nhiên, trong lúc chưa thu được tiền thì lại nhận được ngay những ý kiến không hài lòng về chất lượng, làm cho thành quả của nó buộc phải có điểm dừng nhất định. Vì thế, thay vì tiếp tục đầu tư để hoàn thiện EV Tran, Softex đã chuyển sang hướng mới là xây dựng từ điển đa ngữ. Sản phẩm này cũng sắp hoàn thành để đưa ra thị trường và hy vọng sẽ là bước tiến mới không chỉ giữa tiếng Anh và tiếng Việt mà còn với nhiều ngôn ngữ khác.

    ID: B0910_74