• Thứ Hai, 24/01/2011 18:09 (GMT+7)

    Muốn lưu trữ nhiều dữ liệu? Hãy nuốt vào bụng

    Huy Thắng
    Với công nghệ hiện nay, nếu bạn cần phải lưu trữ đến 900.000GB dữ liệu, bạn có biết hệ thống lưu trữ tương ứng sẽ có khối lượng bao nhiêu không?

    Hãy thử tính xem: 900.000GB là khoảng 880TB. Ổ đĩa 2TB Quadra 2big của LaCie có khối lượng khoảng 2,7kg. Như vậy 900.000GB dữ liệu sẽ cần đến 440 ổ đĩa 2TB Quadra, và sẽ có khối lượng khoảng 1,25 tấn.

    Một nhóm 11 sinh viên của Trường Đại học Trung Quốc của Hồng Kông đang nghiên cứu quá trình “lưu trữ sinh học” (hay có thể nói đó là nghệ thuật), có nghĩa là lưu trữ dữ liệu trong các tế bào vi khuẩn. Trong dự án này, nhóm nói trên dùng vi khuẩn Escherichia coli, cũng còn được gọi là E. coli, là loại vi khuẩn thường gây ngộ độc thức ăn và nhiễm trùng đường tiết niệu.

    Rõ ràng là lưu trữ dữ liệu trong tế bào vi khuẩn tương đối đơn giản (nếu bạn khéo tay ở cấp độ tế bào!). Theo tường thuật của hãng thông tấn AFP, nhóm sinh viên nói trên đã phát triển một phương pháp nén dữ liệu, rồi tách chúng ra và phân bố vào giữa các tế bào vi khuẩn. Các sinh viên này tách ADN khỏi các tế bào vi khuẩn, vận dụng ADN để phản ánh dữ liệu đã được lưu trữ bằng cách dùng enzym, rồi trả chúng về lại cho một tế bào mới.

    Dĩ nhiên là nhóm nghiên cứu cũng ánh xạ ADN để sau này ta có thể tìm ra vị trí thông tin dữ liệu được lưu trữ. Nhóm cũng đã tạo được một hàng rào bảo mật 3 lớp để mã hóa dữ liệu, cùng với các cơ cấu hãm bên trong để đảm bảo các đột biến trong tế bào không làm hỏng dữ liệu.

    Văn bản, hình ảnh, âm nhạc và video, tất cả có thể được lưu trữ trong các tế bào – và chỉ với 1g vi khuẩn ta có thể lưu trữ một khối lượng thông tin tương đương với 450 ổ đĩa cứng dung lượng 2TB.

    Điều này có nghĩa là bạn có thể giữ được các tập hợp dữ liệu lớn trong một thời gian dài trong một hộp vi khuẩn để trong tủ lạnh, theo Aldrin Yim, một giáo sinh và cũng là người đoạt huy chương vàng trong giải iGEM của Viện Công nghệ MIT, phát biểu với AFP.

    Đây không phải là lần đầu vấn đề lưu trữ sinh học được nói đến. Vào năm 2007, các nhà khoa học của Trường Đại học Keio (Nhật Bản) đã mã hoá thành công “e=mc2 1905!” (thuyết tương đối của Einstein) trong ADN của vi khuẩn Bacillus subtilis có trong đất trồng.

    Vậy tại sao chúng ta phải dùng vi khuẩn để lưu trữ dữ liệu, trong khi chúng ta có các phương pháp tiên tiến để lưu trữ dữ liệu như ổ đĩa flash? Hẳn phải có vài điểm thuận lợi.

    • Trước hết, vi khuẩn ở khắp mọi nơi và luôn sinh tồn. Vi khuẩn không chỉ có mặt khắp mọi nơi (ngay cả trong trực tràng, nơi có thể có E. coli), mà còn có thể sinh tồn trong mọi điều kiện. Vi khuẩn Deinococcus radiodurans có thể sinh tồn ngay cả khi bị diệt bằng hạt nhân.
    • Hai là, vi khuẩn sinh sản liên tục, và dữ liệu được lưu trữ trong ADN của chúng. Điều này có nghĩa là dữ liệu có thể được lưu hàng ngàn năm khi ADN đã mã hóa được truyền từ thế hệ này sang thế hệ khác.
    • Sau cùng là vi khuẩn không thể bị hack. Theo giáo sinh Allen Yu đã phát biểu với AFP, tất cả các loại máy tính đều có thể bị sự cố về điện hay bị đánh cắp dữ liệu. Nhưng vi khuẩn miễn nhiễm với tấn công qua mạng của tin tặc. Bạn có thể lưu giữ an toàn thông tin của mình.

    Đáng tiếc là đột phá này không có nghĩa là bạn thôi phải trả tiền mua ổ đĩa cứng gắn ngoài, vì dự án vẫn còn trong thời kỳ phôi thai. Những gì nhóm sinh viên đã làm được là chứng tỏ rằng có thể đạt được các nguyên tắc cơ bản, nhưng phải còn lâu lắm bạn mới có thể chọn mua được ổ lưu trữ sinh học (lại phải cần đến một nhóm các nhà khoa học làm việc trong phòng thí nghiệm nữa để nghiên cứu việc phục hồi dữ liệu cho các ổ lưu trữ này).

    Nguồn: Macworld, 22/1/2011