• Thứ Sáu, 08/10/2010 15:13 (GMT+7)

    Dịch thơ bằng máy

    Lê Duy
    Với việc dịch thuật, chuyển ngữ một văn bản thông thường đã là khó, chuyển ngữ văn học càng khó hơn. Nay Google lại đang để tâm nghiên cứu dịch thơ, bằng máy.

    Ngay cả những nhà dịch thuật "lão làng" cũng phải ngán ngại việc dịch thơ vì nó đòi hỏi nhiều ràng buộc khắt khe hơn nhiều so với dịch văn xuôi. Sau khi dịch, thứ người đọc bị mất rõ ràng nhất là phong cách hành văn của tác giả. Và khi mua một tác phẩm dịch, người đọc đã phải "hy sinh" yếu tố đó rồi, và phải chấp nhận đọc theo văn phong của dịch giả. Đó là chưa kể đến nhiều yếu tố rất "khó" cần có nếu muốn có được bản dịch sát với bản gốc nhất, đặc biệt là dịch giả cần thông thạo không chỉ ngôn ngữ mà cả nền văn hoá, văn minh của cả 2 quốc gia. 

    Lại nói đến chuyện dịch thơ của Google, có thể thấy đây chỉ là một cách thách thức trí tuệ nhân tạo mà thôi. Google đã nghiên cứu ban đầu khả năng dịch thơ này. Nhưng trước khi đề cập đến dịch thơ, ta cần nói đến cách dịch văn xuôi của cỗ máy này trước.
     
    Google Dịch không phải dựa trên từ điển của họ mà trước hết, Google tham chiếu những đề xuất dịch của "người" và lưu các đề xuất này thành cơ sở dữ liệu. Những câu chữ nào ngoài phạm vi "tham chiếu" này thì Google mới dựa vào từ điển. Google gọi hệ thống dịch này là Statistical Machine Translation. Nhưng cách này chỉ có thể tạm "dùng được" với những ngôn ngữ thông dụng như Anh, Pháp, Đức... Với tiếng Việt hoặc các ngôn ngữ ít phổ biến khác, Google Dịch không thể dịch đúng được ở mức cơ bản nhất đối với những câu phức, nhiều ý, nhiều vế câu.
     
    Còn với việc dịch thơ, bước đầu, Google chỉ đang thử nghiệm trên 2 ngôn ngữ được cho là dịch "thành công" nhất của họ đến nay là Anh và Pháp. Dịch thơ ngoài việc chuyển tải đầy đủ ý nghĩa, câu thơ dịch còn ràng buộc bởi vần thơ, nhịp điệu và các luật thơ (như thể thơ tứ tuyệt, lục bát, thất ngôn bát cú...), và đó mới là thách thức thực sự cho AI (trí tuệ nhân tạo) của máy tính. Thơ lại không đặt nặng về cấu trúc ngữ pháp như văn xuôi nhưng thể thơ và vần điệu mới là yếu tố làm nên bài thơ. Các nhà nghiên cứu Google đã cố "gò" để tìm những từ đồng nghĩa có cùng vần điệu để làm sao khi dịch vẫn giữ được nghĩa của bài thơ và không phá luật thơ.
     
    Google hiện chưa công bố chương trình dịch này vì theo họ, chương trình chạy còn chậm và chưa hoàn chỉnh. Tuy vậy, những thí nghiệm bước đầu của họ cho thấy những kết quả đáng mừng. Một số ví dụ:
     
    Một khổ thơ trong tác phẩm "Essai monographique sur les Dianthus des Pyrénées françaises" của Edouard Timbal Lagrave và Eugène Bucquoy được chuyển dịch sang tiếng Anh theo nhịp 2/2 với từ được gieo vần ở cuối câu.
     
    "So here's / the dear / child un/der land,
    will not / reflect / her beau/ty and
    besides / the Great, / no al/ter dark,
    the pure / ray, fronts / elect/ed mark."
     
    Đoạn thơ trong La Henriade của văn hào Voltaire được chuyển dịch theo nhịp 3/4 và gieo vần ở cuối câu.
     
    These words com/passion forced / the small to / lift her head
    gently / and tell him / to whisper: / “I'm not dead."
     
    Dù vậy, có vẻ Google quá ôm đồm. Nếu họ đầu tư nhiều hơn vào AI cho dịch văn xuôi hiện thời với các ngôn ngữ khác thì hợp lý hơn. Có thể đến một lúc nào đó rào cản ngôn ngữ không còn là vấn đề lớn để cho mọi người giao tiếp với nhau dễ dàng hơn. Nhưng với thơ, một mảng nội dung "cao cấp" của con người, được sáng tạo để làm phong phú tâm hồn con người thì chỉ có con người mới thấu hiểu thực sự được. Có thể đến một ngày nào đó, AI của máy tính có thể dịch được nội dung ở mặt ngữ nghĩa (nghĩa đen) của một bài thơ mà thôi, còn tiếng mẹ đẻ là ngôn ngữ không chỉ để giao tiếp của mỗi dân tộc, mà còn để cảm nhận những gì tinh tuý trong thơ văn mà mỗi dân tộc có được, có muốn chuyển dịch cũng không chuyển hết được.
    Từ khóa: Google