• Thứ Ba, 06/03/2007 10:50 (GMT+7)

    CNTT hợp tác cùng ngôn ngữ học

    Lời tòa soạn: TGVT - PCW B tháng 2/2007 đã có bài phản ánh về những bức xúc xung quanh vấn đề chuẩn tiếng Việt trên máy tính và bàn phím dành riêng cho tiếng Việt - một vấn đề tưởng chừng đơn giản nhưng nhiều năm qua đã không được thực hiện. Chủ đề "Bàn phím tiếng Việt" không ngờ đã gợi mở và thu hút thêm nhiều ý kiến khác về việc phát triển CNTT, chuẩn hóa, đưa ngôn ngữ Việt vào hệ điều hành...

    Để đạt được mục tiêu phát triển CNTT Việt Nam thì điều rất cần làm là phải chỉ ra được đâu là đòi hỏi tối thiểu cho mỗi quốc gia, mỗi dân tộc.

    Nhìn lại lịch sử

    Ngay từ khi xuất hiện chiếc máy vi tính đầu tiên, công việc mà cộng đồng tin học trong nước và hải ngoại phải thực hiện là đưa vào đó các ký tự riêng của tiếng Việt để phục vụ giao diện người – máy, lưu trữ tài liệu và các công việc về in ấn, xuất bản... Thuận lợi là Việt Nam có chữ viết theo hệ Latinh, thế nên hàng loạt bộ mã tiếng Việt trên cơ sở lợi dụng bảng mã ASCII tiêu chuẩn cùng quy tắc soạn thảo trên bàn phím tiếng Anh đã ra đời, như VietStar, VNI, BKED, Vietwin, Free Code, Vietware, Vietkey, Vietspell... Tuy nhiên, do thiếu chỉ đạo và quy hoạch chung nên đã tồn tại khoảng 40 bộ mã tiếng Việt khác nhau. Chính vì thế, việc gửi dữ liệu để cùng sử dụng rất khó thực hiện, đòi hỏi phải có một quy chuẩn chung.

    Bộ phần mềm ABC theo tiêu chuẩn TCVN 5712:1993 do ban chỉ đạo chương trình Quốc gia về CNTT đặt hàng 3 tác giả Quách Tuấn Ngọc (BKED), Phan Văn Hùng (Free Code) và Đặng Minh Tuấn (Vietkey) thực hiện năm 1995 tuy chỉ giành được chỗ đứng ở một số địa phương miền Bắc (do sự phổ biến của hệ soạn thảo BKED trước đó với cách thức soạn thảo theo mã telex) nhưng trong một chừng mực nào đó, ABC cũng có giá trị lịch sử và cũng đạt được một sự thống nhất trong các cơ quan nhà nước.

       

    Việc nghiên cứu, thiết kế một loại bàn phím riêng là điều hết sức quan trọng và cần thiết. Tuy nhiên, điều đó chỉ khả thi và có kết quả nếu được thực hiện ngay từ đầu, khi mà máy tính còn chưa phổ biến. Còn khi đã thành thói quen thì việc thiết kế và sản xuất một loại bàn phím riêng cho tiếng Việt e là không khả thi vì khó được cộng đồng chấp nhận.

     

    Ở giai đoạn tiếp theo, bảng mã Unicode 16 bit với 2 cách thức mã dựng sẵn và tổ hợp cho ký tự tiếng Việt đã được bộ KHCN chọn thống nhất sử dụng theo mã dựng sẵn. Mặc dù lúc đầu tích cực phản đối, thậm chí tuyên bố không hỗ trợ nhưng cuối cùng người khổng lồ Microsoft cũng đành phải chấp nhận thực tế.

    Về vấn đề bàn phím tiếng Việt, năm 1993, khi máy vi tính chưa phổ biến ở Việt Nam, hãng máy tính Fujitsu đã đề xuất hỗ trợ bộ KHCN dự án nghiên cứu sản xuất bàn phím riêng cho tiếng Việt. Rất tiếc, vì nhiều lí do, dự án đã không đi đến kết quả như mong muốn. Trên thực tế, với nhiều ngôn ngữ hệ Latinh như Pháp, Đức, Tây Ban Nha..., vị trí các chữ cái trên bàn phím khác với trình tự của bàn phím tiếng Anh. Còn với các quốc gia chữ viết không theo hệ Latinh như Nga, Hàn Quốc, Thái Lan..., bàn phím phải được sản xuất theo những tiêu chuẩn riêng.

    Đòi hỏi sự tham gia của ngôn ngữ học

    Khi viết tay hay đánh máy chữ, độ chuẩn xác chính tả phụ thuộc vào chính người viết. Còn với văn bản soạn thảo bằng máy tính phải chính xác, nhất quán về chính tả một cách tự động. Chính từ đòi hỏi đó, khi xây dựng hệ soạn thảo BKED, TS Quách Tuấn Ngọc đã buộc phải nghiên cứu những tri thức đó để đưa vào. Chính BKED là hệ soạn thảo đầu tiên trên môi trường MS-DOS thực hiện được việc kiểm lỗi chính tả đơn âm tiết một cách tự động trên cơ sở thống nhất đánh dấu ghép vần theo một chuẩn chung. Thậm chí, theo TS Quách Tuấn Ngọc, nếu không có BKED, không ít người trong giới ngôn ngữ học cũng không để ý xem dấu phải đặt vào đâu (không để ý chứ không phải không biết).

    Nói về ngôn ngữ học, một số chuyên gia trong ngành ví nó như toán học của khoa học xã hội. Chính vì vậy, một chuyên gia CNTT có uy tín đưa ra quan điểm rằng các nhà toán học và chuyên gia CNTT có thể dùng kiến thức của mình để nghiên cứu ngôn ngữ học và cho ra những kết quả mà bản thân giới ngôn ngữ học chưa làm được.

    Rõ ràng, sự hợp tác giữa hai giới tin học và ngôn ngữ học hết sức cần thiết. Đi đầu trong lĩnh vực này của giới ngôn ngữ học Việt Nam phải kể đến cố giáo sư Hoàng Phê. Theo ông, không phải tình cờ mà các công cụ lập trình như Pascal, Fotran, Lisp... được gọi là "ngôn ngữ". Như thế đủ thấy ngôn ngữ đã xâm nhập trước tiên vào CNTT và được biến cải để phục vụ CNTT. Sau đó đến lượt CNTT xâm nhập vào ngôn ngữ và làm biến đổi cách nghĩ, cách sử dụng ngôn ngữ, phát triển thêm chức năng mới cho ngôn ngữ ngoài chức năng chính của nó. Điều mà ông cảm thấy tiếc là hình như thiếu một chủ trương toàn diện của Nhà Nước trong lĩnh vực này và chưa có những chương trình hợp tác chính thức giữa hai bên.

    Đến cuối năm 2003, lần đầu tiên một hội thảo chung giữa hai giới CNTT và ngôn ngữ học được tổ chức tại ĐH KHXH&NV Hà Nội. TS Nguyễn Chí Công, trưởng ban Khoa Học Công Nghệ Hội Tin Học Việt Nam nhìn nhận rằng sự hợp tác cần thiết này chính là bản sắc của CNTT Việt Nam. KS Đặng Minh Tuấn, trưởng nhóm Vietkey thì tỏ ý tiếc vì trong dự thảo "Chiến lược quốc gia về CNTT-TT" mà bộ BCVT xây dựng đã thiếu sót vấn đề hết sức quan trọng này. PGS TS Trần Trí Dõi, chủ nhiệm khoa Ngôn Ngữ Học ĐH KHXH&NV Hà Nội thừa nhận sự thiếu sót của dự thảo chiến lược một phần là lỗi của chính giới ngôn ngữ học. Tuy nhiên theo ông, dự thảo vẫn có thể điều chỉnh, bổ sung nếu như có những kiến nghị xác đáng của cả hai giới CNTT và ngôn ngữ học. Nhưng cuối cùng vào tháng 10/2005, dự thảo "Chiến lược quốc gia về CNTT-TT" đã được Chính Phủ phê duyệt với sự bỏ ngỏ vấn đề này.

    Thế nhưng, người khổng lồ Microsoft vẫn từng bước hiện diện tại Việt Nam và không chỉ dừng ở chuyện "đòi" tiền bản quyền mà cả vấn đề bản địa hoá tiếng Việt cho các phiên bản Windows và Office. Microsoft đã dự định là các phiên bản tiếng Việt sẽ có giá phù hợp hơn cho người sử dụng tại Việt Nam thay vì mức giá rất "quốc tế hoá” với phiên bản tiếng Anh. Song, cũng cần lưu ý trong Luật CNTT mới có hiệu lực đã chỉ rõ phải tách bản quyền nội dung ra khỏi bản quyền phần mềm. Bản quyền phần mềm thuộc về Microsoft nhưng bản quyền nội dung thì không thể. Đó chính là chủ quyền của Việt Nam trong bối cảnh toàn cầu hoá mà Microsoft đang thống lĩnh.

    Trịnh Nguyễn

    ID: B0703_9