chữ Thái Việt Nam, Unicode đã chấp nhận bản đề nghị N3120, đặt chữ Chăm ở khu vực từ U+AA00 tới U+AA5F, liền trước chữ Thái Việt Nam." /> chữ Thái Việt Nam, Unicode đã chấp nhận bản đề nghị N3120, đặt chữ Chăm ở khu vực từ U+AA00 tới U+AA5F, liền trước chữ Thái Việt Nam."/> chữ Thái Việt Nam, Unicode đã chấp nhận bản đề nghị N3120, đặt chữ Chăm ở khu vực từ U+AA00 tới U+AA5F, liền trước chữ Thái Việt Nam." />
  • Thứ Năm, 10/04/2008 18:20 (GMT+7)

    Bàn phím chữ Chăm Việt Nam

    Gần như cùng lúc với chữ Thái Việt Nam, Unicode đã chấp nhận bản đề nghị N3120, đặt chữ Chăm ở khu vực từ U+AA00 tới U+AA5F, liền trước chữ Thái Việt Nam.

    Giới thiệu chung

    Tổng cộng, chữ Chăm Việt Nam có 96 điểm mã, nhưng hiện mới sử dụng 83 điểm, tạm phân loại như sau:

    • AA00-AA28: 41 chữ chính, người Chăm gọi là chữ “cái”, gồm 35 phụ âm đầu và 6 nguyên âm viết đầu vần (coi như có gắn phụ âm câm)
    • AA29-AA36: 14 ký tự ghi nguyên âm và các âm đệm, nhìn như các dấu phụ viết trên, dưới, trước, sau chữ cái
    • AA40-AA4E: 14 ký tự ghi phụ âm cuối
    • AA50-AA59: 10 ký tự ghi số 0,1,2…9
    • AA5C-AA5F: 4 ký tự dấu câu cổ truyền của chữ Chăm.

    Chữ Chăm có gốc ở hệ thống chữ Brahmic xuất xứ từ Ấn Độ khoảng thế kỷ 5 trước CN, có liên hệ với chữ Khmer là một dân tộc gần gũi với người Chăm, cùng ở miền Nam bán đảo Đông Dương. Do phân nửa người Chăm theo đạo Hồi nên chữ viết của họ còn chịu ảnh hưởng bởi hệ thống ngôn ngữ và chữ viết Arab, thông qua tiếng Malaysia. Chữ Chăm mang điểm đặc trưng nhất của họ chữ Brahmic là tuy dòng chữ viết từ trái sang phải như các ngôn ngữ Latinh, nhưng các ký tự nguyên âm và âm đệm không viết sau phụ âm đầu, thuận theo thứ tự phát âm, mà có thể đứng trước, đứng sau, đứng trên hay đứng dưới các phụ âm, đủ cả 4 phía.

    Về thứ tự lưu trữ văn bản trong máy, hiện còn là vấn đề bỏ ngỏ, có thể là theo thứ tự trực quan (gần trùng với thứ tự viết tay), hay theo thứ tự phát âm. Tổ chức Unicode chủ trương ủng hộ thứ tự phát âm, tức theo như chữ Ấn Độ, nhưng nếu vậy sẽ gặp khó khăn khi xử lý hiển thị, vì phải có mô đun xử lý sắp xếp lại vị trí các ký tự. Hơn nữa, hiện nay người Chăm đã chịu ảnh hưởng nhiều của tiếng Việt và cách viết chữ quốc ngữ Việt, có xu hướng viết theo thứ tự nhìn thấy: trái trước phải sau, trên trước, dưới sau… và muốn lưu giữ thông tin trong máy đúng theo thứ tự viết này - khác với thứ tự phát âm nhiều.

    Các vấn đề về font chữ Chăm

    Hiện tại, người Chăm thường dùng hệ thống font của một số trí thức người Chăm trên trang www.gilaipraung.com. Hệ thống font này khởi đầu từ font “Blue 1.1” của Lưu Đức Hiển, đã dùng chế bản cuốn từ điển Chăm Việt (GS Bùi Khánh Thế chủ biên, NXB KHXH 1995), các font tiếp sau đã bổ sung sắp xếp lại mã và chau chuốt thêm tự dạng. Các font này đều dùng phương pháp ghi đè mã ASCII của các ký tự tiếng Anh nên có thể đánh vào văn bản bằng bàn phím tiếng Anh mà không cần tới các chương trình quản lý bàn phím. Nhưng, đây là một phương pháp phi chuẩn, kéo theo khá nhiều điều bất tiện, không thể dùng trong các trao đổi quốc tế, và khó có thể phát triển về sau.

    Ngoài vấn đề về mã số, so với bộ font chuẩn Unicode (proposal N3120) còn có các điểm khác biệt là vẽ thêm 6 dấu tổ hợp dựng sẵn (chiếm thêm 6 điểm mã, chứ không dùng phương pháp tổ hợp từ các dấu lẻ như font Unicode), ngoài ra nhiều dấu câu Latinh như (.,?”;:+-) vẫn dùng nhưng bị đổi sang mã khác!

    Về bộ font Chăm chuẩn Unicode, hiện chúng tôi đã xây dựng được 2 font theo đúng hệ thống mã chuẩn Unicode (proposal N3120), mỗi dấu phụ đơn ứng với một điểm mã, các dấu tổ hợp được ghép từ các dấu đơn nên phải chấp nhận một số dấu phụ nằm trên phụ âm chính sắp xếp có thể hơi lệch vị trí, chưa được đẹp.

    Bàn phím cho chữ Chăm

    a. Phiên bản trên Windows:

    Bố trí bàn phím Chăm:

    Trên Windows, chúng tôi đang xây dựng bàn phím chữ Chăm gồm 2 chương trình độc lập là “Bàn phím trực quan” (visual) gõ bằng chuột dành cho người mới học để làm quen với bố trí bàn phím, và “Bàn phím thực” vốn dành cho những người đã thành thạo. Sau khi bàn bạc kỹ với nhóm trí thức Chăm ở gilaiprraung.com, chúng tôi thấy nên dùng bố trí bàn phím của họ để tiện phổ biến đến người dùng cuối, nhưng tuân theo mã chuẩn Unicode, dùng với bộ font Unicode Chăm chuẩn, và có vài cải tiến là đưa vào các ký tự dấu câu cổ truyền của chữ Chăm. Ngoài ra có cung cấp thêm một mẫu bàn phím riêng của chúng tôi, vận dụng phương pháp gõ lặp phím của kiểu gõ Telex tiếng Việt. 

    Nhóm thiết kế đã có sự nghiên cứu cẩn thận, đi sâu vào các đặc điểm của văn tự chữ Chăm cũng như các quy luật ngữ âm, chính tả chữ Chăm v.v... nhằm có các sản phẩm bàn phím và font chữ Chăm hoàn chỉnh và nghiêm túc, có thể đáp ứng được nhu cầu học tập, phổ biến chữ Chăm cũng như bảo tồn nền văn hóa dân tộc Chăm nói chung. Hiện chúng tôi đang tiếp tục sửa chữa hoàn chỉnh và sẽ đưa lên mạng sau khi hoàn thành. 

    b. Phiên bản trên Linux:

    Minh họa bộ gõ chữ Chàm đang hoạt động trên Hacao Linux:

    Nhóm tác giả đã có phối hợp với nhóm m17n ở viện Khoa Học và Công Nghệ Công Nghiệp Cao AIST - Nhật Bản để đưa việc xử lý chữ Chăm vào hệ điều hành Linux mã nguồn mở, cùng với chữ Thái Việt Nam và chữ Hán-Nôm đã đưa vào từ trước, tạo thành một hệ thống hỗ trợ đa ngữ riêng cho Việt Nam trên nền Linux, có tính hoàn chỉnh và nhất quán.

    Do m17n đã được thừa nhận ở tầm quốc tế, nên đã được Fedora và Ubuntu (là những hệ thống Linux thông dụng nhất) hỗ trợ, cho phép tải về các gói thư viện m17n biên dịch sẵn cho chúng. Ngoài ra, có thể tải trực tiếp mã nguồn ở: http://www.m17n.org và tự biên dịch, cách này thì không phụ thuộc vào phiên bản Linux nào.

    Để sử dụng, máy tính cần cài một phiên bản hệ điều hành Linux như Fedora, Ubuntu, hay Hacao, sử dụng bộ gõ mặc định là SCIM, và sau đó tải về và cài thêm các gói scim-m17n, m17n-lib, m17n-contrib, m17n-im-config thì sẽ xuất hiện một mục menu cho phép chọn bàn phím chữ Chăm, có tên là “cmc-kbd”. Về font chữ Chăm, chúng tôi đã đưa file Cham_Roman.ttf lên địa chỉ: http://128.122.140.98/~huesoft/chucham/Cham_Roman.ttf

    Có thể dùng phiên bản Ubuntu-vi của nhóm HanoiLUG có cài sẵn m17n-1.4.0, rồi tải thêm file “cmc-kbd.mim”, là file định nghĩa của bàn phím chữ Chăm, copy vào thư mục của m17n (mặc định là /usr/local/share/m17n), link để tải riêng file đó là: http://cvs.m17n.org/viewcvs/m17n/m17n-db/MIM/cmc-kbd.mim?rev=1.3&view=log). Nếu bản Ubuntu-vi 10.04 của HanoiLUG sắp tới dùng m17n version 1.5.1 thì sẽ có sẵn bàn phím chữ Chăm luôn, không phải tải về nữa. Chúng tôi cũng đang phát triển 1 phiên bản Hacao Linux với hỗ trợ đa ngữ scim-m17n, sẽ cài đặt sẵn đầy đủ cả font chữ và bộ gõ cho chữ Thái Việt Nam, chữ Chăm, chữ Hán-Nôm v.v... và giới thiệu địa chỉ tải về sau khi hoàn chỉnh.

    Bố trí bàn phím trên Linux cũng như bản dùng trên Windows, tức là theo www.gilaipraung.com, font chữ cũng có thể dùng font Cham_Roman.ttf  ở trên, cài font đơn giản bằng cách copy nó vào thư mục \usr\share\X11\fonts.

    Phan Anh Dũng, trung tâm CNTT Thừa Thiên Huế; Email fanzung@gmail.com.

    ID: O0804_1