• Thứ Sáu, 12/12/2014 00:00 (GMT+7)

    Gangnam Style, YouTube và câu chuyện bùng nổ dữ liệu

    Bùi Lê Duy
    (PCWorldVN) Việc đoạn video ca nhạc Gangnam Style có quá nhiều lượt xem khiến YouTube phải nâng cấp hồi đầu tuần chính là dấu hiệu cho thấy đã đến lúc thế giới điện toán 32-bit cần ra đi.

    Cụ thể, khi đó, tài khoản Google+ của YouTube xuất hiện đoạn câu post với nội dung "Gangnam Style’ has been viewed so many times we have to upgrade!" (Gangnam Style đã được xem quá nhiều, do đó YouTube cần phải nâng cấp).

    Gangnam Style, đoạn clip mô tả rapper người Hàn Quốc Psy giả dạng cao bồi theo nhiều kiểu khác nhau đã tạo cơn sốt thực sự trên toàn cầu khi xuất hiện lần đầu tiên vào tháng 7/2012.

    Cho dù đã qua đợt "đỉnh" về lượng truy cập nhưng số lượng người xem clip ca nhạc này vẫn tiếp tục tăng ổn định cho đến con số lượt xem đạt 2.147.483.647.

    Gangnam Style vượt qua giá trị "đỉnh" mà một số nguyên 32-bit có thể đếm được.

    Tại sao con số này lại gây vấn đề?

    Bất cứ khi nào một mẩu dữ liệu được tạo trong một máy tính thì nó phải chiếm một vùng nào đó trên RAM còn trống trên PC. Điều này là thực, ngay cả với dữ liệu gì đó đơn giản như một con số, dữ liệu càng nhiều thì PC cần nhiều bộ nhớ hơn, nên số càng lớn thì cũng cần nhiều bộ nhớ hơn. Con số lớn nhất có thể đại diện cho một số nguyên 32-bit là 2.147.483.647 (tương đương 232, sau đó chia 2, vì một nửa là dành cho số âm, trừ đi 1 vì sử dụng cho số 0). Phạm vi số nguyên đó là đã đủ cho hầu hết phép tính thông thường, nhưng lại không đủ để xử lý phép đếm đối với clip ca nhạc của "Psy béo".

    Trong trường hợp với những con số lớn hơn phạm vi này, như đoạn video ca nhạc của Psy, thì chúng ta phải chuyển sang phép tính số nguyên 64-bit. Lúc này, bộ nhớ cần xử lý nhiều hơn gấp đôi, nhưng cũng có thể chứa dải số lớn hơn nhiều so với 32-bit. Vậy đâu là giới hạn của 64-bit?

    Cụ thể, con mới sẽ là 9.223.372.036.854.775.808.

    Khi Gangnam Style đạt mốc 2 tỷ lượt xem hồi tháng 5 vừa qua, các kỹ sư Google ghi nhận điều này và sớm dự kiến số lượt xem sẽ vượt qua giới hạn của số nguyên 32-bit. Để sửa vấn đề này, đơn giản chỉ việc thay đổi không gian bộ nhớ được chỉ định cho dữ liệu đếm ấy từ 32-bit sang 64-bit, mà thực chất chỉ là thay đổi nhỏ và không làm đảo lộn mã nguồn YouTube.

    Dù vậy, có một điều nảy ra trong suy nghĩ chúng ta là những con số về giới hạn trên có liên quan ít nhiều đến số lượng con người. Đây là trò chơi đếm số, một clip ca nhạc sẽ không thể nào vượt quá được biên độ toán học trừ khi có rất nhiều người xem nó. Con số ấy không chỉ số lượng cụ thể, mà còn mang ý nghĩa con số vô cùng lớn. Do vậy, những thay đổi gần đây của YouTube về giới hạn số đếm được nhiều người quan tâm, không phải khía cạnh máy tính, cũng không phải về khả năng quản trị hệ thống mà bởi vì chúng ta đang chứng kiến sự bùng nổ về dân số sử dụng công nghệ. Hệ điều hành OS X đã bỏ lại tính toán 32-bit vào quá khứ từ phiên bản 10.7 chỉ 1 năm trước khi Gangnam Style xuất hiện. Đó không chỉ là cách mở rộng biên độ tính toán nhưng đó thực sự là nhu cầu cần thiết đối với người dùng.

    Chúng ta đang tương tác với một nền tảng kỹ thuật duy nhất, với một sản phẩm duy nhất chạy trên nền tảng ấy. Nếu so sánh, với khoảng 1,35 tỷ người, Facebook vẫn còn nhiều tiềm năng để tiếp tục tìm kiếm người dùng mới, sử dụng User ID với dữ liệu số nguyên 32-bit. Nhưng điều gì sẽ diễn ra nếu dân số tiếp tục tăng và những vùng sâu, vùng xa ở Trung Quốc, Ấn Độ bắt đầu tiếp cận được với Internet?

    Dân số trên thế giới đã đạt đến biên độ của phép tính 32-bit và trong tương lai thấy được, nhiều người trên Trái đất cùng lúc sở hữu nhiều thiết bị như điện thoại, máy tính xách tay, máy tính bảng, thiết bị đeo trên người.

    Big Data là danh từ được cộng đồng công nghệ nói đến nhiều trong thời gian vừa qua, và nhiều nghiên cứu cũng cho rằng bùng nổ dữ liệu khiến những kỹ thuật xử lý truyền thống trước nay không còn phù hợp nữa. Có lẽ những quy ước cũ vẫn cần đến nhưng đã đến lúc chúng ta cần mua thêm nhiều RAM hơn, cần chuyển đổi như thế nào đó để thích nghi với bùng nổ dữ liệu.

    Nguồn: Wired