• Thứ Tư, 07/01/2004 16:35 (GMT+7)

    Nén dữ liệu và ảnh

    Định nghĩa: Nén là phương pháp mã hoá dữ liệu số nhằm làm giảm dung lượng và giảm đòi hỏi băng thông để truyền đi. Có hai phương pháp nén căn bản: nén có thất thoát, trong đó một số dữ liệu sẽ bị mất khi các tập tin được giải nén; nén bảo toàn, không làm mất dữ liệu khi tập tin được phục hồi định dạng gốc.

    Nén dữ liệu (văn bản, hình ảnh, âm thanh hay video), nói một cách đơn giản là tách dữ liệu thành những kí hiệu ngắn mà máy tính có thể giải mã được để giảm kích thước nguyên thuỷ xuống còn 10 đến 99%, giảm dung lượng và yêu cầu băng thông khi truyền trên internet. Ngoài ra, có nhiều phương pháp cho phép nén nhiều tập tin vào một tập tin duy nhất. Có hai phương pháp căn bản để nén dữ liệu: thất thoát và bảo toàn thông tin. Kỹ thuật bảo toàn thông tin nén dữ liệu mà không loại bỏ hay làm mất bất kỳ thông tin nào. Khi tài liệu gốc được giải nén, nó giữ nguyên thông tin ban đầu đến từng bit. Kỹ thuật thất thoát cho phép nén tập tin thậm chí còn nhỏ hơn, nhưng một số thông tin sẽ mất vĩnh viễn.


    Nén bảo toàn thông tin (NBTTT)

    Chương trình NBTTT tìm dữ liệu thừa hoặc lặp lại trong toàn bộ tài liệu và sau đó mã hoá. Ví dụ, một văn bản có chứa 200 khoảng trắng, 100 từ “in” và 50 từ “the defendant said” Chương trình tìm những từ, ngữ, khoảng trắng lặp này và thay chúng bằng chuỗi bit hay ký hiệu số cho từng loại rồi lưu trong “từ điển”. Khi giải nén tập tin, chuỗi bit được giải mã và dữ liệu được phục hồi. Dữ liệu không bị mất hay thay đổi. Có rất nhiều chương trình nén dữ liệu như StuffIt (cho Macintosh) của Aladdin Systems; Winzip (cho Windows) của Winzip Computing và PKZip của PKWare. PKZip là một trong những chương trình nén phổ biến nhất cho DOS và Windows.

    Sự phát triển của internet cũng làm cho việc nén trở nên quan trọng vì dung lượng, băng thông chính là tiền bạc. Tài liệu thông thường như bảng tính Microsoft Excel hay PowerPoint có thể thu nhỏ một nửa kích thước ban đầu, những tài liệu có nhiều con số và sự lặp lại có thể nén xuống còn 20% kích thước ban đầu.

     Nén thất thoát thông tin (NTTTT)

    Đối với tín hiệu âm thanh, hình ảnh, video, kiểu NTTTT thường được sử dụng. Âm thanh và video có thể nén xuống còn 5% so với kích thước gốc. Tai và mắt người khó có thể phát hiện được sự thất thoát dữ liệu này. Ví dụ hình ảnh bị mất thông tin có thể không sắc nét bằng hình ảnh gốc nên làm cho những lá cỏ dường như bị mờ đi.

    Computerworld 21/08/2000

    Chuẩn nén

    Joint Photographic Experts Group (JPEG): Phương pháp nén ảnh tĩnh với tỷ lệ nén lên đến 20-1 mà không làm mất thông tin đáng kể.

    Lempel-Ziv-Welch: Giải thuật này được dùng trong nhiều định dạng nén, kể cả định dạng có thể trao đổi đồ hoạ và Tag Image File Format mà ta thường gọi là TIFF.

    Moving Pictures Experts Group (MPEG): Phương pháp nén thất thoát thông tin dùng cho video. MPEG-1 dùng cho CD-ROM và video CD. MPEG-2 nén video cho truyền hình thông thường và độ nét cao.

    MPEG Audio Layer 3 (MP3): Công nghệ nén âm thanh sử dụng một phần chuẩn MPEG-1 để nén âm thanh chất lượng CD với hệ số 12.

    Fractal: Phương pháp nén thất thoát dữ liệu cho ảnh màu, rất phù hợp với những đối tượng tự nhiên, tỷ lệ nén có thể lên đến 100-1.

    PKZip: Chương trình shareware nén dữ liệu bảo toàn thông tin phổ biến của công ty PKWare. Chương trình này dùng một giải thuật và thư viện dữ liệu để mã hoá hay “gộp” nhiều tập tin khác nhau. PKUnzip giải nén các tập tin về trạng thái nguyên thuỷ.

    Wavelet: Dạng nén thất thoát thông tin sử dụng hàm toán học để nén hình ảnh với tỷ lệ lớn hơn những phương pháp khác – có thể đạt ¼ kích thước của cùng bức ảnh nén bằng JPEG.

    Windows Media Technology: Sản phẩm của Microsoft, cho chất lượng âm thanh tốt hơn MP3 đối với tập tin cùng kích thước, cũng như chất lượng video gần bằng DVD.

    ID: A0205_70