• Thứ Ba, 17/05/2011 23:54 (GMT+7)

    Mua siêu máy tính: Hãy hỏi Trung Quốc

    NND
    Các kỹ sư Trung Quốc đã phát triển bộ xử lý Godson 3B hiệu suất cao, đạt những chỉ tiêu xuất sắc về hiệu quả tiêu thụ năng lượng.

    Nền kinh tế Trung Quốc mới chỉ vươn lên vị trí thứ 2 thế giới mới đây, nhưng từ khá lâu, Trung Quốc đã dẫn đầu thế giới trong một số lĩnh vực nhất định. Và giờ đây, đến lượt Trung Quốc trở thành siêu cường máy tính của thế giới.

    Ngay từ năm ngoái, các hệ thống máy tính của Trung Quốc đã chiếm vị trí đầu tiên và thứ ba trong danh sách Top500 siêu máy tính mạnh nhất thế giới, lọt vào số rất ít đấu thủ chinh phục được "cửa ải" petaflops (1 petaflop = 1 triệu tỷ phép tính dấu chấm động/giây).

    Đứng đầu thế giới là hệ thống siêu máy tính song song đa luồng Tianhe-1A trên nền tảng các bộ xử lý 6 nhân của Intel (Intel Xeon X5670/2, 93GHz với số lượng 14.336 chiếc, và các bộ xử lý của nVidia Tesla M2050 với 7.168 chiếc. Hệ thống đã đạt được 2.566 TFLOPS theo quy trình thử nghiệm HPC Linpack, chạy hệ điều hành Linux và tiêu thụ 4MW điện.

    Lọt vào vị trí đứng đầu Top500 siêu máy tính thế giới là hệ thống Tianhe-1A trên nền các bộ xử lý Intel Xeon và bộ xử lý đồ hoạ nVidia Tesla. Ảnh của nVidia.

    Có một chi tiết kinh ngạc khác là Tianhe 1A sử dụng các kết nối Arch do Viện Hàn lâm Khoa học Trung Quốc phát triển, có băng thông lớn gấp đôi so với Infiniband 4X QDR - nhanh nhất trong các kết nối từng được sử dụng trong các hệ thống máy tính Beowulf thuộc Top500. Topology Arch, với cấu trúc kết nối hình cây mập (fat tree), có độ trễ chỉ 1,6 micro giây. Nhưng ngay cả thế vẫn chưa đủ, Trung Quốc đã tuyên bố xuất xưởng bộ xử lý hiệu suất cao Godson 3B, có hiệu suất sử dụng năng lượng tốt với năng suất đỉnh đạt 128 GFLOPS mà chỉ tiêu thụ đến 40W. Nhưng cấu trúc kết nối và bộ xử lý - những thành phần chính trong của các siêu máy tính hiện đại - mới quyết định hiệu suất tính toán.

    Hiệu suất của Godson 3B trên một đơn vị công suất là 3,2 GFLOPS/W. Để so sánh, ở bộ xử lý hàng đầu hiện nay là nVidia C2050, thông số đó là 2,2 GFLOPS/W; ở bộ xử lý sáu nhân Xeon W3690/3,5 GHz với vector mở rộng AVX thì thông số đó chỉ là 1,3 GFLOPS/W.

    Godson 3B hoạt động ở các xung nhip lên đến 1,05GHz, có 8 nhân xử lý 464V (V là viết tắt của vector) và có 685 triệu transistor trên diện tích gần 300 milimét vuông. Vi mạch Godson 3B chứa các thiết bị vector - với các vector 256 bit (4 lần số 64 bit dấu chấm động). Mỗi nhân có 8 thiết bị hỗ trợ các lệnh DP "nhân và cộng" và kết quả là có 16 DP cho mỗi xung của nhân. Công ty STMicroelectronics đang sản xuất những bộ xử lý này theo quy trình 65 nm.

    Những thông số kỹ thuật chi tiết của Godson 3B chưa được phổ biến nhưng rõ ràng là chip chứa 1 bộ nhớ đệm cấp 2 (cache level 2) dung lượng 4MB và các cache lệnh và cache dữ liệu 64KB cấp 1 với tỉ lệ 1 trên mỗi nhân. Các nhân xử lý là dạng bộ xử lý siêu bậc thang (xuất 4 lệnh trong một xung) RISC, với hiệu suất rất cao sử dụng hệ thống lệnh MIPS64.

    Những chỉ dấu này càng chứng tỏ hiệu suất đỉnh của siêu máy tính đạt được một cách dễ hơn không phải ở kiến trúc CISC dạng x86-64 mà trên kiến trúc RISC (tuy nhiên, trong các chip dòng Godson có các thiết bị hỗ trợ phần cứng cho x86). Godson 3B chứa 2 bộ kiểm soát bộ nhớ DDR3 và 2 cổng AMD 16-bit AMD HypertTransport.

    Có cả một câu chuyện riêng về kết nối giữa các nhân của Godson 3B. Thay vì sử dụng kết nối với mô hình kết nối (topology) dạng vòng (như trong bộ xử lý 8 nhân mới của Intel Itanium - Poulson), các nhà phát triển Godson đã chọn topology hình lưới. Dĩ nhiên, các nhà phát triển ở đây không từ bỏ những topology đầu tiên. Các bộ xử lý 32 và 64 bit với kết nối liên nhân dạng đó giảm tiêu thụ điện năng so với kết nối dạng vòng, và topology dạng lưới giảm chiều dài chung của các dây dẫn cần thiết.

    Thế nhưng chế tạo liên kết topology vòng rẻ hơn. Intel cho biết các kết nối liên nhân theo vòng cho phép bổ sung số nhân xử lý và cache theo mô-đun dễ hơn và khi đó, chi phí phát sinh không cao. Các nhà phát triển Godson cho rằng, tuy thế, việc ứng dụng kết nối liên nhân theo vòng sẽ nảy sinh nhiều vấn đề khi số nhân vượt quá 32.

    So sánh các topology vòng và lưới có thể tìm thấy trong bất kỳ sách giáo khoa về kiến trúc máy tính nào. Trong dạng vòng, khả năng thông qua được cố định, còn trong dạng lưới thì tuỳ số lượng nút. Độ trễ trong topology vòng tăng tịnh tiến theo số lượng nút N còn trong dạng lưới thường thì theo căn bậc 2 của N. Nhưng topology trên Godson là loại lưới không đơn giản và còn cần tính tới độ dễ dàng và chi phí khi triển khai. Nói chung, cần đánh giá dựa trên thành phẩm.

    Theo các nhà phát triển Godson, bộ xử lý tiếp theo Godson 3C sẽ được sản xuất theo quy trình 28 nm. Godson 3C sẽ có 16 nhân, năng suất 512 GFLOPS và ở xung nhịp 1,5GHz và chỉ tiêu thụ tổng cộng 20W. Các bộ xử lý Godson 3B (sau là 3C) sẽ được sử dụng ở siêu máy tính Dawning 6000 của Trung Quốc.

    Chuyện gì sẽ xảy ra nếu người Trung Quốc bắt đầu xuất khẩu các bộ xử lý và thậm chí siêu máy tính của họ? Nếu họ sở hữu công nghiệp chế tạo bộ vi xử lý kích thước nhỏ, họ sẽ trở thành đối thủ cạnh tranh nguy hiểm của Mỹ.

    Nguồn: Computerworld Nga, 15/5/2011