• Thứ Bảy, 27/11/2010 07:22 (GMT+7)

    Intel: Bộ xử lý nghìn nhân là có thể

    NND
    Tập đoàn Intel đang phát triển cơ chế tổ chức trao đổi thông tin giữa những khối lượng cực lớn các nhân của bộ xử lý: Việc chế tạo bộ xử lý nghìn nhân là có thể.

    "Bộ xử lý 48 nhân thử nghiệm do Intel chế tạo chứng tỏ khả năng xây dựng những bộ xử lý có hàng nghìn nhân trong tương lai", Nhà nghiên cứu của Tập đoàn Intel Timothy Mattson phát biểu tại Hội thảo Supercomputer 2010 tổ chức mới đây ở New Orleans, Mỹ.

    Kiến trúc bộ xử lý 48 nhân mà các nhà nghiên cứu gọi là Single Chip Cloud Computer - SCC (điện toán mây trên chip đơn) theo khẳng định của Mattson là loại có quy mô tuỳ ý: “Các nhân có thể được bổ sung theo cách hoàn toàn tự do. Về nguyên tắc, chúng ta có thể thiết lập bộ xử lý với thậm chí 1.000 nhân”. Tuy nhiên, với số lượng nhân như thế, đường kính của mạng lõi nối các nhân với nhau sẽ lớn đến mức sẽ ảnh hưởng tiêu cực lên năng suất.

    Intel tin chắc sự phát triển tiếp theo các bộ xử lý sẽ theo con đường tăng số nhân trên mỗi đế chip. Nhưng cùng với sự gia tăng số nhân, các kỹ sư của Công ty phải khắc phục những phức tạp nhất định về kết cấu. Kiến trúc của các bộ xử lý đa nhân hiện nay của Intel dựa trên sự tập hợp các giao thức đảm bảo tính cố kết (coherency) của bộ nhớ cache - nhận dạng dữ liệu từ bộ nhớ hệ thống và phân bổ cho từng nhân. Cùng với sự gia tăng của số nhân, việc duy trì tính cố kết của bộ nhớ cache ngày càng trở nên phức tạp hơn. Mattson cho biết: “Chất tải từ việc xử lý các giao thức cố kết do số nhân tăng dần sẽ dẫn tới “bức tường cố kết” - là khi ưu thế của việc bổ sung số nhân sẽ không còn”.

    Theo khẳng định của Mattson, giải pháp thông minh hơn là phải từ bỏ cơ chế cố kết bộ nhớ cache và thay thế nó bằng hệ thống trao đổi thông tin giữa các nhân. Nhóm kỹ sư trong đó có Mattson đang nghiên cứu phát triển cơ chế truyền thông tin hỗ trợ gia tăng số nhân trên đế chip. Bộ xử lý thử nghiệm 48 nhân được chế tạo trong khuôn khổ chương trình Intel TeraScale. Theo Mattson, bộ xử lý này không nằm trong kế hoạch chuyển thành thương phẩm. Các mẫu chip khối lượng hạn chế đã được phân phát trong nội bộ các nhà nghiên cứu và lập trình để họ có thể thiết lập các công cụ phát triển.

    Nguyên mẫu của bộ xử lý 48 nhân được chế tạo theo quy trình công nghệ 45nm gần một năm trước. Nó là một ma trận từ 6x4 tấm lót (tile), mỗi tấm giữ 2 nhân. Trong bộ xử lý có hơn 1,3 tỷ transistor còn công suất tiêu thụ thay đổi từ 25Wđến 125W. Để cho đơn giản, các kỹ sư lấy kết cấu sẵn có của bộ xử lý Pentium năm 1994 làm cơ sở cho các nhân. “Năng suất của loại chip này không phải là vấn đề chính”, Mattson giải thích. Bộ xử lý sử dụng chuẩn kiến trúc x86. Tính mới của chip nằm ở các giải pháp kiến trúc tấm lót và hạ tầng. Mỗi nhân có một thành phần giao diện để liên lạc với mạng lõi. Thành phần giao diện này đóng các dữ liệu thành các gói và kết nối với bộ định tuyến có trong đế chip. Mỗi tấm lót cũng có bộ nhớ đệm để truyền các thông tin - dung lượng bộ nhớ 16KB.

    Các kỹ sư đã thử nhiều cách để tối ưu hóa trao đổi thông tin giữa số lượng lớn các nhân. Các nhà nghiên cứu tổ chức việc truyền dữ liệu qua giao thức TCP/IP và trên mỗi nhân, họ cài một bản sao hệ điều hành riêng dựa trên Linux. Trên cơ sở của chip, về nguyên tắc, có thể tổ chức một chuỗi 48 nút Linux, nhưng, theo Mattson, "nó sẽ là quá nhàm chán". “Vấn đề các model lập trình khác nhau đáp ứng được những đặc điểm nổi bật của bộ xử lý này đã làm cho nhiệm vụ trở nên thú vị hơn”, Mattson cho biết. Các kỹ sư cũng đã phát triển một thư viện nhỏ các giao diện lập trình ứng dụng API để hỗ trợ các chức năng trao đổi thông tin giữa các nhân với cái tên RCCE. Các thử nghiệm chứng tỏ rằng trao đổi thông tin qua RCCE có thể diễn ra với tốc độ như là trong các chuỗi Linux-Cluster theo giao thức TCP/IP. Cả 2 phương pháp tốt như nhau trong việc tổ chức cố kết giữa các nhân.

    “Những kết quả sơ bộ cho thấy, bộ xử lý SCC và API để truyền thông tin là nền tảng phát triển phần mềm hiệu quả - Nhóm kỹ sư báo cáo - Những khó khăn phía trước liên quan đến chưa có cơ chế truyền tin không đồng bộ”. Mattson cũng nói về những khả năng tiết kiệm điện năng của SCC. Xung nhịp của từng tấm lót có thể biến đổi. Các nhà lập trình truy cập được tới các chức năng cho phép các ứng dụng có thể thay đổi xung nhịp cũng như điện áp nguồn cho nhân. Tuy nhiên, như Mattson cảnh báo, những chức năng này có thể tạo thêm khó khăn cho các lập trình viên: “Xác định chương trình đang đòi hỏi điện áp nguồn cho nhân xử lý nào là nhiệm vụ không hề đơn giản”.

    Nguồn: IDG News Service Nga, 26/11/2010