• Thứ Sáu, 09/01/2004 09:04 (GMT+7)

    Unicode đã đến hồi "Uni"


    Cách đây hai tháng, PC World Việt Nam đã mở ra cuộc tranh luận về bộ mã ký tự tiếng Việt theo Unicode. Diễn đàn về Unicode đã thu hút sự tham gia của nhiều nhà chuyên môn và người sử dụng. Bốn số PC World B và PC World A trong các tháng 6, 7/2002 đã dành nhiều trang đăng tải những bài gửi về từ khắp nơi, cả trong và ngoài nước.

    Cũng từ đó, các nhà chuyên môn và những người có trách nhiệm về vấn đề này đã đề nghị Tạp Chí mở một diễn đàn trao đổi trực tiếp. Chúng tôi đã “gửi” diễn đàn này vào buổi hội thảo chiều 26/7 vừa qua, trong khuôn khổ Diễn Đàn CNTT Việt Nam 2002 do Hội Tin Học TP.HCM tổ chức. Đúng là hội thảo hôm ấy rất hấp dẫn. Hội trường chật cứng cho đến phút cuối. Điều đó nói lên sự quan tâm của mọi người với câu chuyện Unicode, một vấn đề lớn của CNTT Việt Nam.

    Cho tới hội thảo chiều 26/7 ấy, và sau các bài viết đã đăng cũng như chưa đăng, chúng tôi tin rằng đã đến lúc có thể gói ghém vấn đề, gói ghém những tranh biện sôi nổi trong hai tháng qua.

     

    Dẫu sao thì Unicode cũng đã đến hồi Uni  

    1. Tiêu chuẩn TCVN 6909 là kịp thời và hợp lý. Trong điều kiện hiện nay, không thể thu hẹp TCVN 6909 hơn nữa, nghĩa là cần chấp nhận sự tồn tại những cách mã hoá khác nhau cho một chữ Việt, cụ thể là cả mã dựng sẵn và mã tổ hợp.

    Việc chấp nhận như vậy có dẫn đến những phức tạp cho người dùng không? Chắc chắn là có (như ý kiến của tác giả Bùi Quang Ngọc, qua bài đăng trong PC World B số 8/2002, tr. 12). Các nhà nghiên cứu cho rằng một phần mềm đã hỗ trợ Unicode thì phải “trong suốt” với người dùng, dù thông tin được mã hoá bằng các cách khác nhau nhưng theo chuẩn Unicode. Thực tế hiện nay chưa được như vậy. Một minh chứng đơn giản là Microsoft khổng lồ đến thế mà vẫn chưa hỗ trợ mã dựng sẵn. Nếu chúng ta tổ chức dữ liệu theo mã dựng sẵn thì khi muốn làm gì với chúng, chẳng hạn tìm kiếm, sắp xếp thì chúng ta phải tự lo hoặc phải chờ đến lúc Microsoft “trong suốt” trọn vẹn trong môi trường Unicode.

    Tóm lại, nỗi băn khoăn của anh Bùi Quang Ngọc là chính đáng, cần được giải quyết. Nhưng lại không thể loại bỏ mã dựng sẵn, cũng như không thể loại bỏ mã tổ hợp trong TCVN 6909; vì chọn cách nào thì chúng ta cũng bỏ phí gia tài trí tuệ không nhỏ và lại tự đặt mình vào những khó khăn, có khi còn hơn cả việc chấp nhận cả hai rồi tìm cách giải quyết những vướng mắc của nhiều doanh nghiệp phần mềm cũng như người dùng. Và như thế, chúng ta đi đến kết luận thứ hai sau đây...

    2.  Trong phạm vi nhất định, trong khi thế giới phần mềm còn chưa “trong suốt” với người dùng, nên quy định những gì cần thống nhất, ở đâu cần thống nhất. Nếu không thì tháp Baben chữ Việt 8-bit sẽ được thay bằng tháp Baben TCVN 6909 (Unicode)!

    Như vậy, chúng ta đứng trước những câu hỏi khó nhất phải trả lời. Đó là:

                 Phạm vi cần thống nhất một cách mã chữ Việt theo chuẩn Unicode?

                 Loại mã nên chọn cho phạm vi cần thống nhất này?

    Về phạm vi cần thống nhất, chúng tôi cho rằng có hai vấn đề lớn: phạm vi công việc, và phạm vi tổ chức. Mọi tư liệu trong các mối quan hệ giữa các cơ quan chính phủ (thường gọi là G2G) và giữa các cơ quan chính phủ với doanh nghiệp, với người dân (thường gọi là G2B và G2C) cần được quy định chỉ thể hiện bằng một loại mã.

    Loại mã nên chọn: Sự sáng suốt chính là ở chỗ này. Cần nhắc lại rằng có 3 trường phái:

    - Thứ nhất: Không cần quy định thống nhất, ai thích cái gì dùng cái nấy. Vì công cụ chuyển đổi, nhận dạng mã không thiếu và về nguyên tắc thì các phần mềm phải “trong suốt”.

    - Thứ hai: Chọn kiểu mã dựng sẵn.

    - Thứ ba: Chọn kiểu mã tổ hợp.

    Chúng tôi ủng hộ quan điểm 2 và 3, cho rằng cần chọn hoặc dựng sẵn hoặc tổ hợp để đảm bảo sự nhất quán trong phạm vi như vừa nêu trên. Chọn kiểu nào sẽ phụ thuộc hai yếu tố chính sau đây:

    - Chọn kiểu nào để những người có liên quan (trong phạm vi phải thống nhất như trên) phải đầu tư ít hơn.

    - Chọn kiểu nào để những người có liên quan (trong phạm vi phải thống nhất như trên) tiếp thu giải pháp dễ hơn. Cần nhớ rằng họ là những người sử dụng có thể không mấy am hiểu CNTT.

    Cả hai tham số này chưa được nghiên cứu sâu sắc. Chúng tôi đề nghị các cơ quan nhà nước có trách nhiệm tổ chức nghiên cứu kỹ vấn đề này trước khi quyết định. 

    3. Dù chọn kiểu mã nào cho những khu vực cần thống nhất thì bản chất bộ mã chữ Việt 6909 vẫn là không đơn định. Phải xem việc phát triển (bằng sức mình hay có hỗ trợ quốc tế) các phần mềm hỗ trợ tiếng Việt trên bộ mã 6909 là chuyện lớn của quốc gia, có đầu tư nhân lực, tài lực xứng đáng. Việc duy trì tính không đơn trị này tạo ra một thị trường lớn cho các công ty làm phần mềm. Giới CNTT chắc hẳn không xem đó là chuyện mừng mà là nhiệm vụ lớn phải cùng nhau giải quyết.

    Sau khi đã quyết định phạm vi phải đảm bảo mã đơn định và chọn một phương án, các cơ quan hữu trách cần nhanh chóng tổ chức việc tạo ra các công cụ quan trọng nhất hỗ trợ các quyết định của mình. Việc xây dựng bộ công cụ này là việc rất cần khẩn trương nhưng thận trọng. Chúng ta đã có những quyết định chưa tối ưu trong quá khứ, liên quan đến vấn đề mã chữ Việt. Vì vậy, phải làm sao thu hút được nhiều nhất sự đóng góp của cộng đồng CNTT trong nước, ngoài nước.

     

    Bạn đọc quý mến!

    Chúng tôi rất mong nhận được ý kiến phản hồi của các bạn về các ý kiến trên đây. Hơn nữa, việc triển khai bộ mã chữ Việt theo chuẩn Unicode thực sự chưa bắt đầu, hãy còn rất nhiều vấn đề phức tạp. Vì vậy, chúng tôi mong tiếp tục nhận được ý kiến các bạn để Tạp Chí có thể chuyển tới các cơ quan quản lý, cơ quan triển khai nhằm có được giải pháp đúng nhất cho vấn đề mã chữ Việt - một vấn đề trọng đại đối với CNTT Việt Nam và cả sự hội nhập của Việt Nam.

    Xin chân thành cảm ơn các anh chị đã tham gia Diễn Đàn Unicode hết sức quan trọng này trên PC World Việt Nam.

     

    Tổng Biên Tập Tạp Chí

    Thế Giới Vi Tính - PC World Việt Nam

    ID: A0208_49