• Thứ Năm, 25/12/2003 11:23 (GMT+7)

    Dữ liệu ẩn trong tập tin mutimedia

    Sự phát triển mạnh mẽ của World Wide Web đem đến tiềm năng thương mại cho việc cung cấp thông tin đa phương tiện (multimedia) trên Net. Một trong những vấn đề quan tâm hàng đầu của các nhà kinh doanh trên Net đó là việc bảo vệ bản quyền. Thông tin trao đổi trên Internet thường được cung cấp dưới dạng số hóa. Tuy nhiên, dạng thông tin số hóa này có thể dễ dàng sao chép và sửa đổi. Một bộ phim, một bài nhạc dạng số hóa phân phối trên mạng có thể dễ dàng bị một người nào đó sao chép để sử dụng hoặc sửa đổi và phân phối lại gây thất thu cho sở hữu chủ. Công nghệ nhúng dữ liệu ẩn trong thông tin multimedia được coi là một trong những giải pháp cho vấn đề này.  

    Giới thiệu


    Hình 1: Sơ đồ kỹ thuật nhúng dữ liệu ẩn trong tập tin multimedia

    Kỹ thuật dữ liệu ẩn đã có lịch sử lâu đời và đã từng được thực hiện với nhiều phương thức từ loại mực đặc biệt không thấy được, vi ảnh cho đến truyền thông phổ rộng. Hẳn các bạn đã từng nghe nói đến loại mực đặc biệt sau khi viết trên giấy và để khô thì không thể đọc được bằng mắt thường, thông tin ẩn chỉ hiện ra khi hơ nóng hoặc bôi hóa chất đặc biệt lên giấy.
    Kỹ thuật nhúng dữ liệu ẩn khác với kỹ thuật mật mã, tuy trong nhiều tình huống chúng cùng mục đích (chỉ cho những người có quyền truy cập được phép xem dữ liệu). Một trong những vấn đề của hệ thống mật mã là nó có thể bị tấn công để bẻ khóa. Trong khi đó, kỹ thuật nhúng dữ liệu ẩn tăng cường tính bảo mật nhờ che giấu thông tin truyền tải. Vì vậy, kỹ thuật nhúng dữ liệu ẩn thường được dùng bổ sung với kỹ thuật mật mã. Nó có thể dùng để nhúng dữ liệu ẩn vào bất kỳ dạng dữ liệu số nào, đặc biệt là các dạng có mức dư thừa thông tin cao như dữ liệu ảnh màu tĩnh và động, dữ liệu âm thanh và thậm chí cả dữ liệu văn bản. Dữ liệu ẩn có thể có nhiều định dạng, nó có thể là một chuỗi ký tự đơn giản hoặc một tập tin Word hoặc Excel. Trong bài viết này, chúng ta sẽ xem xét  kỹ thuật nhúng dữ liệu ẩn vào file hình

    Cấu trúc dữ liệu ẩn
    Cấu trúc của dữ liệu ẩn thể hiện trong hình 2. Tập tin multimedia chứa dữ liệu ẩn được gọi là tập tin mang. Dữ liệu ẩn được nhúng trực tiếp vào tập tin mang. Việc xem hoặc nghe tập tin mang theo cách thông thường không thể phát hiện ra dữ liệu ẩn. Cần có công cụ phần mềm đặc biệt để thực hiện việc nhúng và phát hiện dữ liệu ẩn. 

    Nguyên lý nhúng dữ liệu ẩn
    Hiện có nhiều kỹ thuật nhúng dữ liệu ẩn. Về cơ bản, các kỹ thuật này đều thực hiện việc ghi chèn thông tin yêu cầu vào dữ liệu hình hoặc âm thanh theo cách thức không làm hư hỏng dữ liệu gốc. Sự biến đổi của dữ liệu gốc hầu như không thể nhận biết. Có ba cách thức chính để giấu thông tin vào tập tin multimedia. Cách đầu tiên là chèn thẳng thông tin ẩn vào tập tin multimedia mang. Cách thứ hai đòi hỏi thực hiện một số phân tích để tìm ra mức độ biến đổi màu sắc để đặt thông tin ẩn vào vùng khó bị phát hiện nhất. Cách thứ ba là chèn thông tin ẩn theo cách ngẫu nhiên.
    Một trong những kỹ thuật phổ biến này là chèn từng bit của thông tin ẩn vào bit có giá trị thấp nhất (LSB – Least Significant Bit) của dữ liệu nhị phân hình. Phương thức này thực hiện đơn giản nhưng có khuyết điểm là thông tin ẩn dễ bị mất khi nén hình. Chúng ta hãy xét một ví dụ đơn giản thực hiện nhúng một chữ A vào 3 pixel của một hình 24 bit màu. Dưới đây là dữ liệu nhị phân gốc của hình mang:
    ( 00100111 11101001 11001000 )
    ( 00100111 11001000 11101001 )
    ( 11001000 00100111 11101001 )
    Giá trị nhị phân của chữ A là (10000011) và việc nhúng chữ A vào các bit cuối cùng của 3 pixel trên sẽ cho kết quả sau:
    ( 00100111 11101000 11001000 )
    ( 00100110 11001000 11101000 )
    ( 11001000 00100111 11101001 )
    Lưu ý rằng chỉ những bit có gạch dưới phải thay đồi để tạo chữ A. Với sự thay đổi nhỏ như trên thì rất khó nhận biết bằng mắt thường. Một số  công cụ phần mềm sử dụng phương thức LSB khá phổ biến là EzStego, S-Tools. Bạn có thể tham khảo thông tin về các công cụ phần mềm nhúng dữ liệu ẩn ở www.ise.gmu.edu/~njohnson/Security/stegtools.htm và www.blackhat.org/stego.htm.
     

    Những yêu cầu chung đối với dữ liệu ẩn
    - Tác động rất ít đến chất lượng dữ liệu multimedia
    - Định dạng dữ liệu multimedia không bị thay đổi và việc thay đổi dung lượng không đáng kể.
    - Dữ liệu ẩn được nhúng đều trên toàn bộ tập tin multimedia chứ không chỉ lưu trữ ở phần đầu  hoặc phần cuối tập tin.
    - Dữ liệu ẩn vẫn được giữ lại khi tập tin multimedia bị sửa đổi, nén hoặc chuyển đổi định dạng.
    - Dữ liệu ẩn khó bị thay đổi, ghi đè hoặc gở bỏ.
    - Thao tác đưa vào dữ liệu ẩn và lấy dữ liệu ẩn phải đơn giản.
     

    Ứng dụng
    Dữ liệu ẩn có thể phân thành hai loại: loại công khai và loại bí mật. Loại dữ liệu ẩn công khai có thể được dùng để xác định nguồn gốc, bản quyền của thông tin. Đây là dạng mà các công ty phim ảnh và âm nhạc dùng. Loại dữ liệu ẩn bí mật có ưu điểm hơn so với loại dữ liệu ẩn công khai vì sự hiện hữu của nó khó bị phát hiện và nhờ vậy khả năng bị tấn công ít hơn. Loại này có thể được dùng để kiểm tra sự thay đổi dữ liệu (như kiểm tra “checksum”) hay dùng để truyền tải thông điệp bí mật mà chỉ những ai biết mã khóa mới có thể đọc được – đây có thể xem là dạng thông tin trong thông tin.


                       Hình 2

    Kỹ thuật nhúng dữ liệu ẩn khác với các kỹ thuật mã hóa dữ liệu. Thông tin multimedia có nhúng dữ liệu ẩn không bị “khóa”, mỗi thông tin được bảo vệ tự thực hiện việc bảo mật chứ không cần đến hệ thống bảo mật đầu cuối – thường là loại đắt tiền. Cơ chế bảo mật này linh động và có chi phí thấp; có thể kết hợp với các kỹ thuật mã hóa khác để tăng độ an toàn.
    Kỹ thuật nhúng dữ liệu ẩn có nhiều ứng dụng: bảo vệ bản quyền, kiểm soát sao chép, truyền tải thông tin .... Hiện nay đã có một số ứng dụng thương mại của kỹ thuật này, như cơ chế xác thực dùng trong máy ảnh số nhằm cấm thay đổi ảnh chụp, cơ chế kiểm soát sao chép đĩa DVD, cơ chế bảo vệ bản quyền nhạc số và sẽ có nhiều ứng dụng khác nữa trong tương lai.

    Thanh Phong
    Tham khảo từ Internet: Steganography and Digital Watermarking Technology

    ID: A0202_47