• Thứ Tư, 10/12/2003 11:30 (GMT+7)

    Giấu tin trong dữ liệu đa phương tiện

    Cùng với sự bùng nổ của Internet, nạn ăn cấp bản quyền, xuyên tạc, truy cậo trái phép gia tăng... Vấn đề an toàn và bảo mật thông tin đang được quan tâm.

    Giấu tin trong dữ liệu đa phương tiện - một công nghệ mới đầy hứa hẹn
        Cùng với sự bùng nổ của Internet và các phương tiện multimedia, những vấn nạn như ăn cắp bản quyền, xuyên tạc thông tin, truy nhập thông tin trái phép... cũng gia tăng, đòi hỏi phải không ngừng tìm các giải pháp mới, hữu hiệu cho an toàn và bảo mật thông tin. Một  trong các giải pháp nhiều triển vọng là giấu tin (DataHiding), được nghiên cứu phát triển trong khoảng 10 năm gần đây.

    Giấu thông tin là gì?


    Hình 1: Lược đồ chung cho quá trình giấu tin.

        Từ trước đến nay, nhiều phương pháp bảo vệ thông tin đã được đưa ra, trong đó giải pháp dùng mật mã được ứng dụng rộng rãi nhất. Thông tin ban đầu được mã hoá, sau đó sẽ được giải mã nhờ khoá của hệ mã. Đã có rất nhiều hệ mã phức tạp được sử dụng như DES, RSA, NAPSACK..., rất hiệu quả và phổ biến.
        Một phương pháp mới khác đã và đang được nghiên cứu và ứng dụng mạnh mẽ ở nhiều nước trên thế giới, đó là phương pháp giấu tin (DataHiding). Giấu thông tin là  kỹ thuật nhúng (embedding) một lượng thông tin số nào đó vào trong một đối tượng dữ liệu số khác. Một trong những yêu cầu cơ bản của giấu tin là đảm bảo tính chất ẩn của thông tin được giấu đồng thời không làm ảnh hưởng đến chất lượng của dữ liệu gốc.
        Sự khác biệt chủ yếu giữa mã hoá thông tin và giấu thông tin là mã hoá làm cho các thông tin hiện rõ là nó có được mã hoá hay không,  còn với giấu thông tin thì người ta sẽ khó biết được là có thông tin giấu bên trong. 

        Hai sơ đồ trên hình 1 và 2 biểu diễn quá trình giấu tin và quá trình giải tin.

    Phân loại các kỹ thuật giấu tin

    Hình 2: Lược đồ cho quá trình giải mã

        Do kỹ thuật giấu thông tin số mới được hình thành trong thời gian gần đây nên xu hướng phát triển chưa ổn định. Nhiều phương pháp mới, theo nhiều khía cạnh khác nhau đang và chắc chắn sẽ được đề xuất, bởi vậy một định nghĩa chính xác, một sự đánh giá phân loại rõ ràng chưa thể có được. Sơ đồ phân loại trên hình 3 được Fabien A. P. Petitcolas đề xuất năm 1999.

    Hình 3: Một cách phân loại các kỹ thuật giấu tin

        Sơ đồ phân loại này như một bức tranh khái quát về ứng dụng và kỹ thuật giấu thông tin. Dựa trên vic thống kê sắp xếp khoảng 100 công trình đã công bố trên một số tạp chí, cùng với thông tin v tên và tóm tắt nội dung của khoảng 200 công trình đã công bố trên Internet, có thể chia lĩnh vực giấu tin ra làm hai hướng lớn, đó là watermarking và steganography. Nếu như watermark (thủy vân, thủy ấn) quan tâm nhiều đến ứng dụng giấu các mẩu tin ngắn nhưng đòi hỏi độ bền vững lớn của thông tin cần giấu (trước các biến đổi thông thường của tệp dữ liệu môi trường) thì steganography lại quan tâm tới ứng dụng che giấu các bản tin đòi hỏi độ bí mật và dung lượng càng lớn càng tốt. Đối với từng hướng lớn này, quá trình phân loại theo các tiêu chí khác có thể tiếp tục được thực hiện, ví dụ dựa theo ảnh hưởng các tác động từ bên ngoài có thể chia watermark thành hai loại, một loại bền vững với các tác động sao chép trái phép, loại thứ hai lại cần tính chất hoàn toàn đối lập: dễ bị phá huỷ trước các tác động nói trên. Cũng có thể chia watermark theo đặc tính, một loại cần được che giấu để chỉ có một số người tiếp xúc với nó có thể thấy được thông tin, loại thứ hai đối lập, cần được mọi người nhìn thấy.

    Gíâu thông tin nhằm mục đích gì?

        Bảo mật thông tin bằng giấu tin có hai khía cạnh.
    Một là bảo mật cho dữ liệu đem giấu (embedded data), chẳng hạn như giấu tin mật: thông tin mật được giấu kỹ trong một đối tượng khác sao cho người khác không phát hiện được (steganography). Hai là bảo mật chính đối tượng được dùng để giấu dữ liệu vào (host data), chẳng hạn như ứng dụng bảo vệ bản quyền, phát hiện xuyên tạc thông tin (watermarking)... Một số ứng dụng đang được triển khai:
        • Bảo vệ bản quyền tác giả (copyright protection): Đây là ứng dụng cơ bản nhất của kỹ thuật

    Hình 4 Hai ảnh trước và sau khi giấu tin giống hệt nhau

    thuỷ vân số. Một thông tin nào đó mang ý nghĩa quyền sở hữu tác giả (người ta gọi nó là thuỷ vân - watermark) sẽ được nhúng vào trong các sản phẩm, thuỷ vân đó chỉ một mình người chủ sở hữu hợp pháp các sản phẩm đó có và được dùng làm minh chứng cho bản quyền sản phẩm. Giả sử có một thành phẩm dữ liệu dạng  đa phương tiện như ảnh, âm thanh, video cần được lưu thông trên mạng. Để bảo vệ các sản phẩm chống lại hành vi lấy cắp hoặc làm nhái cần phải có một kỹ thuật để “dán tem bản quyền” vào sản phẩm này. Việc dán tem hay chính là việc nhúng thuỷ vân cần phải đảm bảo không để lại một ảnh hưởng lớn nào đến việc cảm nhận sản phẩm. Yêu cầu kỹ thuật đối với ứng dụng này là thuỷ vân phải tồn tại bền vững cùng với sản phẩm, muốn bỏ thuỷ vân này mà không được phép của người chủ sở hữu thì chỉ còn cách là phá huỷ sản phẩm.
    Hình 4 và 5 mô tả (một cách hình thức) ứng dụng của thuỷ vân số trong bảo vệ bản quyền tác giả

        •
    Nhận thực thông tin hay phát hiện xuyên tạc thông tin (authentication and tamper detection): Một tập thông tin sẽ được giấu trong phương tiện

    Hình 5: Thực chất bên trong ảnh có chứa thông tin người chủ sở hữu

    chứa, sau đó được sử dụng để nhận biết xem dữ liệu trên phương tiện gốc có bị thay đổi hay không. Các thuỷ vân nên được ẩn để tránh sự tò mò của đối phương, hơn nữa việc làm giả các thuỷ vân hợp lệ hay xuyên tạc thông tin nguồn cũng cần xem xét. Trong các ứng dụng thực tế, người ta mong muốn tìm được vị trí bị xuyên tạc cũng như phân biệt được các thay đổi (ví dụ như phân biệt xem một đối tượng đa phương tiện chứa thông tin giấu đã bị thay đổi, xuyên tạc nội dung hay là chỉ bị nén mất dữ liệu). Yêu cầu chung đối với ứng dụng này là khả năng giấu thông tin cao và thuỷ vân không cần bền vững.
        Hình 6 và 7 minh hoạ một trong hai ảnh đã bị xuyên tạc và ta khó có thể phát hiện được ảnh nào là giả mạo.


    Hình 6: Clinton và Hillary 


    Hình 7: Clinton và Monic

        • Dấu vân tay hay dán nhãn (fingerprinting and labeling): Thuỷ vân trong những ứng dụng này được sử dụng để nhận diện người gửi hay người nhận một thông tin nào đó. Ví dụ như các vân khác nhau sẽ được nhúng vào các bản copy khác nhau của thông tin gốc trước khi chuyển cho nhiều người. Với những ứng dụng này thì yêu cầu là đảm bảo độ an toàn cao cho các thuỷ vân, tránh khả năng xoá dấu vết trong khi phân phối.
        • Điều khiển truy cập (copy control): Các thiết bị phát hiện thuỷ vân (ở đây sử dụng phương pháp phát hiện thuỷ vân đã giấu mà không cần thông tin gốc) được gắn sẵn vào trong các hệ thống đọc ghi, tùy thuộc vào việc có thủy vân hay không để điều khiển (cho phép/cấm) truy cập. Ví dụ như hệ thống quản lí sao chép DVD đã được ứng dụng ở Nhật.
        • Truyền thông tin mật (steganography): Các thông tin giấu được trong những trường hợp này càng nhiều càng tốt.
    Việc giải mã để nhận được thông tin cũng không cần phương tiện chứa gốc.

    Môi trường giấu tin

        Kỹ thuật giấu tin đã được nghiên cứu và áp dụng trong nhiều môi trường dữ liệu khác nhau như trong dữ liệu đa phương tiện (text, image, audio, video), trong sản phẩm phần mềm và gần đây là những nghiên cứu trên môi trường cơ sở dữ liệu quan hệ.
    Trong các môi trường dữ liệu đó thì dữ liệu đa phương tiện là môi trường chiếm tỉ lệ chủ yếu trong các kỹ thuật giấu tin.

    Giấu tin trong ảnh

        Giấu  thông tin trong ảnh hiện nay chiếm tỉ lệ lớn nhất trong các chương trình ứng dụng, các phần mềm, hệ thống giấu tin trong đa phương tiện bởi lượng thông tin được trao đổi bằng ảnh là rất lớn, hơn nữa giấu thông tin trong ảnh cũng đóng vai trò hết sức quan trọng đối với hầu hết các ứng dụng bảo vệ an toàn thông tin như: nhận thực thông tin, xác định xuyên tạc thông tin, bảo vệ bản quyền tác giả, điều khiển truy cập, giấu thông tin mật...

        Thông tin sẽ được giấu cùng với dữ liệu ảnh nhưng chất lượng ảnh ít thay đổi và chẳng ai biết được đằng sau ảnh đó mang những thông tin có ý nghĩa.
    Ngày nay, khi ảnh số đã được sử dụng rất phổ biến thì giấu thông tin trong ảnh đem lại rất nhiều ứng dụng quan trọng trên nhiều lĩnh vực đời sống xã hội. Ví dụ, trong các dịch vụ ngân hàng và tài chính ở một số nước phát triển, thuỷ vân số được sử dụng để nhận diện khách hàng trong các thẻ tín dụng. Mỗi khách hàng có một chữ kí viết tay, sau đó chữ kí này được số hoá và lưu trữ trong hồ sơ của khách hàng. Chữ kí này sẽ được sử dụng như là thuỷ vân để nhận thực thông tin khách hàng. Trong các thẻ tín dụng, chữ kí tay được giấu trong ảnh của khách hàng trên thẻ. Khi sử dụng thẻ, người dùng đưa thẻ vào một hệ thống, hệ thống có gắn thiết bị đọc thuỷ vân trên ảnh và lấy được chữ kí số đã nhúng trong ảnh. Thuỷ vân được lấy ra sẽ so sánh với chữ kí số đã lưu trữ xem có trùng hợp không, từ đó xác định nhận thực khách hàng.

    Giấu tin trong audio
        Kỹ thuật giấu thông tin trong audio phụ thuộc vào hệ thống thính giác của con người (HAS - Human Auditory System). HAS cảm nhận được các tín hiệu ở dải tần rộng và công suất thay đổi lớn, nhưng lại kém trong việc phát hiện sự khác biệt nhỏ giữa các dải tần và công suất. Điều này có nghĩa là, các âm thanh to, cao tần có thể che giấu được các âm thanh nhỏ thấp một cách dễ dàng. Kênh truyền tin cũng là một vấn đề. Kênh truyền hay băng thông chậm sẽ ảnh hưởng đến chất lượng thông tin sau khi giấu. Giấu thông tin trong audio yêu cầu rất cao về tính đồng bộ và tính an toàn của thông tin.


    Giấu tin trong video
       
    Giấu tin trong video cũng được quan tâm và được phát triển mạnh mẽ cho nhiều ứng dụng như điều khiển truy cập thông tin, nhận thực thông tin và bảo vệ bản quyền tác giả. Ta có thể lấy một ví dụ là các hệ thống chương trình trả tiền xem theo video clip (pay per view application). Các thuật toán trước đây thường cho phép giấu ảnh vào trong video, nhưng gần đây kỹ thuật cho phép giấu cả âm thanh và hình ảnh vào video.
        Giấu tin là một công nghệ mới rất phức tạp, đang được tập trung nghiên cứu ở nhiều nước trên thế giới như Đức, Mỹ, Italia, Canada, Nhật Bản... Những kết quả thực nghiệm cho thấy cần phải có thêm thời gian để nghiên cứu thẩm định, tuy nhiên các nhà khoa học khẳng định rằng đây là một công nghệ mới đầy hứa hẹn cho vấn đề an toàn và bảo mật thông tin.

    Có thể tham khảo, diễn đàn của những người nghiên cứu về watermarking www.watermarkingworld.org.

    ID: A0308_78