• Thứ Năm, 20/03/2008 10:10 (GMT+7)

  Không tìm thấy nội dung text trong trang web sử dụng font Unicode UTF-8

  Câu hỏi :

  Nhập liệu dùng font unicode utf-8 trên website của công ty gặp 2 vấn đề sau:
   
   1. Khi nhập vào nội dung text, hiển thị chính xác, nhưng sau đó tìm kiếm nội dung text đó trong trang người dùng thì không tìm được do chữ Việt nhập vào đã bị mã hóa. Nghĩa là có nội dung tìm được, có nội dung lại không (chương trình search đã test OK). Xin quý báo cho biết cách khãc phục để dữ liệu tiếng Việt gỏ vào không mã hóa?

   2. Copy dữ liệu trên các trang web khác, paste vào ô nhập liệu và nhập vào trang web (viết bãng PHP). Tuy nhiên dữ liệu đó thường kèm theo các thẻ html của trang web cũ nên khi hiển thị trên trang web của tôi không như ý muốn. Xin hỏi có cách nào để copy nội dung text trên các trang web khác mà bỏ đi phần định dạng không?     Trả lời :

   1. Mã tiếng Việt Unicode tương đối mới do đó mức độ hỗ trợ mã Unicode tiếng Việt trên các ứng dụng khác nhau thường rất khác nhau, nhưng nhìn chung chưa được triệt để và trong suốt. Cụ thể việc xử lý chuỗi Unicode tiếng Việt trên các field database từ các ứng dụng có thể bị trục trặc (tạo kết quả không như ý) vì nhiều lý do liên quan đến 3 thành phần sau:

   • Bản thân database có hỗ trợ cách mã hóa mà ta dùng không?
   • Module Provider truy xuất database mà phần mềm nhờ đó hỗ trợ cách mã hóa mà ta dùng không, nếu hỗ trợ thì nó đòi hỏi cú pháp miêu tả chuỗi Unicode như thế nào?

   - Bản thân ngôn ngữ lập trình mà ta dùng để lập trình có hỗ trợ cách mã hóa mà ta dùng không? Nếu hỗ trợ thì nó đòi hỏi cú pháp miêu tả chuỗi Unicode như thế nào?

   Bạn không nói rõ bạn dùng Provider nào và truy xuất database do database server gì quản lý nên chúng tôi không thể hướng dẫn cụ thể qui trình xuất chuỗi Unicode. Nhưng nhìn chung, hầu hết các database server, các Provider và các ngôn ngữ lập trình đều hỗ trợ tốt chuỗi được mã hóa theo UTF-8.

   2. Tùy thuộc vào ứng dụng mà bạn đang dùng để xem/copy nội dung trang web mà hành vi copy nội dung vào clipboard sẽ rất khác nhau: có ứng dụng thì chỉ copy phần nội dung, có ứng dụng thì copy mã nguồn HTML của nội dung... Tùy vào nội dung được copy vào clipboard mà khi dán nó vào ứng dụng khác sẽ cho kết quả gì. Tóm lại, nếu bạn muốn copy dữ liệu có sẵn trong trang web nào đó, bạn nên dùng trình soạn thảo văn bản tổng quát như Wordpad, Word... mở file web gốc như là văn bản thô, tìm kiếm thông tin cần copy, copy chỉ phần thông tin cần thiết và dán kết quả vào trang *.php của mình. 

  Chuyên mục: Tiếng Việt