• Thứ Tư, 17/12/2003 11:22 (GMT+7)

    MP4 - Cuộc cách mạng trong ngành giải trí số

    Cuộc cách mạng trong ngành giải trí số

    Ngay từ khi bùng phát MP3, nhiều chuyên gia đã dự đoán sẽ xuất hiện một chuẩn mới giải quyết bài toán nén video giống như MP3 đã làm với audio, vấn đề chỉ là thời gian. Giờ đây chúng ta đã có tên gọi cho chuẩn này: MPEG-4. MPEG-4 hứa hẹn sẽ làm một cuộc cách mạng trong ngành công nghiệp phim ảnh giống như MP3 trong lĩnh vực âm nhạc.

    MPEG-4 là chuẩn ISO/IEC do Moving Picture Experts Group phát triển, đây cũng là nhóm nghiên cứu đã phát triển các chuẩn MPEG-1 và MPEG-2 rất thành công, đặt tiền đề cho video trên CD-ROM, DVD và truyền hình số.

    Tên chính thức của MPEG-4 là “coding of audio-visual objects” (mã hoá các đối tượng hình-tiếng), tuy nhiên tên khởi đầu của nó là “very low bitrate audio-visual coding” (mã hoá hình-tiếng với tốc độ bit thấp). Điều này cho thấy ý định ban đầu của dự án MPEG-4 là nhằm đưa ra chuẩn hỗ trợ ứng dụng nghe nhìn số trên các kênh truyền tốc độ thấp như mạng kết nối quay số hay di động. Mặc dù lĩnh vực nghe nhìn số đã có nhiều thay đổi so với khi MPEG-4 được khởi xướng – lúc đó web chưa phổ biến – nhưng những tiền đề đặt ra của dự án vẫn đúng và thời gian đã đem đến cơ hội kết hợp và mở rộng các công nghệ mới vào đích nhắm của MPEG-4.

     

    Mô hình nội dung đa phương tiện mới

    Bước đột phá quan trọng của MPEG-4 là xác định phân cảnh nội dung đa phương tiện gồm tập hợp các đối tượng hình-tiếng với các quan hệ nhất định về không gian và thời gian.

    Để hiểu rõ mô hình mới của MPEG-4, chúng ta hãy làm một sự so sánh với MPEG-2.


    Các thành phần MPEG-4

    Trong thế giới MPEG-2, nội dung được tạo từ nhiều nguồn khác nhau như video, đồ hoạ, chữ. Sau khi được “ghép” lại thành các pixel, chúng được mã hoá như tất cả đều là pixel video. MPEG-2 là hệ thống thể hiện tĩnh: nếu một hãng truyền hình phát lại chương trình của một hãng khác, logo (biểu tượng) của hãng phát gốc hay chữ “trực tiếp” của chương trình trực tiếp hôm trước không thể xoá khỏi chương trình. Bạn có thể thêm hình ảnh và chữ vào trình diễn nhưng không thể xoá chúng.

    MPEG-4 ngược lại: nó là hệ thống động. Các đối tượng khác nhau được mã hoá và truyền riêng biệt tới bộ giải mã theo từng luồng truyền riêng. Việc tổng hợp diễn ra sau khi giải mã thay vì trước khi mã hoá như ở MPEG-2.

    Để tổng hợp, MPEG-4 dùng một ngôn ngữ mô tả phân cảnh đặc biệt, gọi là BiFS (Binary Format for Scenes – định dạng nhị phân cho phân cảnh), đây là kết quả của sự hợp tác với tổ chức Web3D Consortium và là phiên bản nhị phân của VRML (Virtual Reality Modeling Language – định dạng văn bản mô tả đối tượng 3D tương tác). BiFS cho phép xác định cách thức nhóm các đối tượng lại với nhau, vị trí và thời điểm các đối tượng xuất hiện trong phân cảnh. Nó còn có thể mô tả “hành vi” (ví dụ như xoay đối tượng hay thực hiện cảnh chuyển giao đan xen giữa hai đoạn video) và cả “hành vi có điều kiện” – hành động tương ứng theo sự kiện tương tác từ người dùng. Tất cả các đối tượng được mã hoá theo lược đồ mã hoá tối ưu của chúng – video được mã hoá theo kiểu video, chữ theo kiểu chữ, đồ hoạ theo kiểu đồ hoạ - thay vì xử lý tất cả các pixel theo kiểu video.

    Mô hình này áp dụng cho cả đối tượng hình và tiếng, tuy nhiên ở đây dẫn chứng đối tượng hình để dễ hình dung. Với cơ chế mã hoá tối ưu cho từng dạng dữ liệu riêng biệt, MPEG-4 có thể mã hoá hiệu quả video, âm thanh, lời thoại và cả các cử động khuôn mặt hay thân hình.

    Mô hình đối tượng của MPEG-4 cho phép xây dựng nội dung đa phương tiện có tính tương tác cao. Người dùng cuối có thể tương tác thay đổi màu, kích cỡ phông chữ, thay đổi vị trí của một đối tượng, làm cho nó biến mất hoặc hiển thị… Việc thao tác nội dung có thể được thực hiện tại đầu cuối hoặc tại đầu phát (dĩ nhiên phải có kênh phản hồi). Sự kiện tương tác người dùng có thể là nhấn chuột hay lệnh nhập từ bàn phím, hoặc thông qua mô tả phân cảnh dùng VRML.

     Đặc biệt, MPEG-4 có đưa ra đặc tả API (Application Program Interface) cho phép nhúng mã lệnh Java vào nội dung đa phương tiện (MPEG-J). MPEG-J cung cấp cơ chế điều khiển lập trình linh hoạt, khác với dạng điều khiển tham số trước đây. Û́ng dụng MPEG-J, được gọi là MPEGlet (dạng giống như Java Applet), có thể chạy được trên nhiều nền tảng hệ thống. BiFS kết hợp mã lệnh Java cho phép xây dựng nội dung đa phương tiện có tính động, tương tác cao, phong phú và hấp dẫn.

    Bạn có thể hình dung một chương trình truyền hình thể thao trực tiếp, sân vận động là đối tượng video nền, các cầu thủ và trái bóng là các đối tượng trên nền sân vận động, bình luận của phát thanh viên là một đối tượng audio và âm thanh nền của sân vận động là một đối tượng audio khác. Thật tuyệt, với phương thức mã hoá đối tượng này bạn có thể giảm âm thanh nền của sân vận động để nghe rõ lời bình luận hoặc tăng nó lên để cảm thụ “không khí” sân đấu, bạn cũng có thể dừng trái bóng đang bay giữa chừng, thay đổi góc nhìn từ đường biên sang từ phía khung thành, hay có thể tương tác với thông tin theo những cách thức mà hiện nay chúng ta chưa hình dung được.

     

    Chuẩn cho thế giới số

    MPEG-4 cho phép xây dựng nội dung đa phương tiện một lần và chạy ở bất kỳ đâu, trên bất kỳ nền tảng hệ thống, với bất kỳ băng thông. Nó đưa ra định dạng chung đáp ứng cho nhiều ứng dụng và thiết bị.

    Thành phần DMIF (Delivery Multimedia Integration Format) của MPEG-4 cung cấp một giao tiếp ứng dụng chung cho phép truy cập các đối tượng nội dung đa phương tiện theo cách thức “trong suốt” đối với các dạng truyền phát, và đảm bảo thiết lập kết nối.

    Định dạng file MPEG-4 (MP4) được thiết kế để chứa nội dung đa phương tiện MPEG-4 theo cách thức linh động cho phép dễ dàng trao đổi, quản lý, sửa đổi và thể hiện. File MP4 có thể chứa thông tin mô tả cách thức truyền phát nội dung theo nhiều giao thức khác nhau, tuỳ theo từng loại thiết bị đầu cuối và băng thông. (Định dạng MP4 được thiết kế theo định dạng QuickTime của Apple Computer Inc.)

    Nhắm đến nhiều phân khúc thị trường khác nhau, MPEG-4́ có thể uyển chuyển đáp ứng nhu cầu của từng lĩnh vực nhất định nhưng vẫn đảm bảo khả năng làm việc chung giữa các ứng dụng của các lĩnh vực khác nhau. Các nhà phát triển có thể chỉ chọn triển khai những thành phần MPEG-4 cần thiết cho ứng dụng của mình. Điều này cho phép giảm đi gánh nặng đối với bộ giải mã.

    Để đảm bảo tính tương thích giữa các sản phẩm MPEG-4, Apple, Cisco, IBM, Kasenna, Philips và Sun Microsystems đã thành lập tổ chức ISMA (Internet Streaming Media Alliance) để định ra các nhóm thành phần chuẩn có thể làm việc chung. Tham gia vào ISMA còn có AOL Time Warner, Dolby Laboratories, Lucent Technologies, National Semiconductor, Sony và nhiều công ty khác.

    Nhiều công cụ giải mã MPEG-4 đã có trên mạng, có cả chương trình chạy độc lập và plug-in cho các phần mềm phổ biến RealPlayers, QuickTime và Windows Media Players, và cả các plug-in cho trình duyệt web. Phiên bản mới QuickTime 6 của Apple tích hợp sẵn hỗ trợ MPEG-4. RealNetworks cũng hỗ trợ MPEG-4 trên máy chủ Helix của mình.

    Về lĩnh vực phần cứng, Sony đang chuẩn bị đưa ra các thiết bị PDA và máy quay video số hỗ trợ MPEG-4. Nhiều máy ảnh số hiện có cho phép lưu theo định dạng MPEG-4. Nhiều hãng điện tử hiện đang phát triển các thiết bị cầm tay, đầu DVD có thể “chơi” MPEG-1, MPEG-2 cùng với MPEG-4.

    Tronh thập niên vừa qua, các công nghệ MPEG là động lực cho sự chuyển đổi phương thức phân phối thông tin từ tương tự (analog) sang số (digital) trên khắp thế giới. Sự chấp nhận rộng rãi đối với công nghệ DVD trong những năm qua là bằng chứng về sự tác động của công nghệ MPEG đối với lĩnh vực giải trí gia đình. Những xu hướng khác như truyền hình cáp, truyền hình vệ tinh, HDTV, PVR (thiết bị ghi video cá nhân) và nhạc số trực tuyến MP3 – tất cả góp phần tạo nên những cách thức thụ hưởng thế giới số.

    Cùng với các chuẩn MPEG khác, MPEG-4 cải tiến và thúc đẩy việc phân phối nội dung số, tạo thêm nhiều ứng dụng mới như VOD (video-on-demand), cung cấp nội dung đa phương tiện di động và nội dung tương tác.

    MPEG-4 cung cấp một chuẩn chung cho nội dung đa phương tiện. Là chuẩn mở, nó tạo  ra một sân chơi bình đẳng, bất kỳ ai cũng có thể tạo công cụ chơi và giải mã MPEG-4 làm việc được với các thiết bị khác.

    MPEG-4 là chuẩn “sống”, nghĩa là nó vẫn được tiếp tục cập nhật các tính năng mới theo sự phát triển công nghệ.

    Phương Uyên

     

    ID: A0304_74