• Thứ Năm, 19/05/2005 11:19 (GMT+7)

    Bắc cầu sang 64-bit

        Mục tiêu chính tiếp theo của thị trường CPU là thiết kế đa lõi, cho phép đặt hai bộ vi xử lý hoặc nhiều hơn trên một chip CPU.
        Opteron của AMD là bộ xử lý của hôm nay và ngày mai. Không như các CPU loại 64Bit khác. Opteron có thể chạy các phần mềm 32bit thông dụng hiện nay, hơn nữa các phần mềm 64bit sẽ rất phát triển trong nay mai. Ở thế hệ đầu tiên, tốc độ của Opteron 64bit đã sánh ngang với IBM Power, HP Alpha và Intel Itanium 2 – theo đánh giá của System Performance Evaluation and Transaction Processing Performance Council.
        Opteron đã có trên thị trường cho loại máy chủ 2 và 4 BXL. IBM ngay lập tức đưa ra cam kết sẽ hỗ trợ BXL này với bản beta của CSDL DB2 64bit, đồng thời hứa hẹn một thị trường máy chủ trên cơ sở BXL Opteron, đối đầu với BXL Xeon và Itanium 2 của Intel.
        Opteron đang là đối thủ trên thị trường máy chủ và trạm làm việc tính toán tốc độ cao (HPC: hight-performance computing) mức khởi đầu và đã được một số nhà sản xuất hệ thống tích hợp vào sản phẩm của mình. Tuy nhiên, các đấu thủ khác không ngồi yên. Trùm Intel đang đe doạ Opteron bằng Itanium 2, trong khi mặc dù lớn tiếng về sự hỗ trợ, Big Blue vẫn gây trở ngại cho Opteron với chip Power5 của mình. Thực chất, AMD đang phải đối mặt với những địch thủ mạnh hơn rất nhiều.

        Rào cản lớn nhất của AMD là Intel. Chip Xeon đang thống lĩnh thị trường máy chủ 32bit, trải rộng từ mức khởi đầu cho đến các hệ thống tầm trung. Intel đã tăng cường cho Xeon bus nhanh hơn và tốc độ bộ nhớ cao hơn. Các hệ thống chạy Xeon có thể tích hợp tới 32 BXL. Điều mà Xeon không đạt được là tính toán 64bit, rất cần thiết cho việc xử lý các CSDL cực lớn và tính toán khoa học. Đây là lĩnh vực mà Itanium 2 và Opteron đang tỏ rõ sức mạnh. Ở mặt trận này, Itanium 2 cũng đang chiếm ưu thế lớn, được các nhà cung cấp hệ thống tín nhiệm, kể cả IBM. Hơn nữa Itanium còn đạt được tốc độ xử lý cao nhờ bộ biên dịch thông minh. Bởi vậy, điều mà AMD trông cậy vào Opteron là giá thấp, tiêu thụ điện năng ít và khả năng chạy được các phần mềm 32bit ở tốc độ hệ thống (native).

    TỰ NHIÊN HAY MÔ PHỎNG

        Ưu thế lớn nhất của Opteron mà không BXL 64Bit nào có được là khả năng chạy các ứng dụng 32Bit ở tốc độ xung nhịp đầy đủ, hay còn gọi là tốc độ tự nhiên của hệ thống (native). Chip Opteron 1,8 GHz chạy các phần mềm 32bit với tốc độ tương đương Xeon 2 GHz của Intel. Ở chế độ này, hay còn gọi là Legacy Mode, Opteron hoạt động không khác gì các chip Athlon với những ứng dụng 32bit và 16bit. Các HĐH 32bit như Windows, Linux và Unix cài đặt và chạy với Opteron ở chế độ Legacy Mode giống như các hệ Xeon.

        Ở chế độ Long Mode, phần cứng 64bit của Opteron được kích hoạt, loại bỏ sự trở ngại về kích thước bộ nhớ, cho phép truy cập vào các thanh ghi 64bit - là phần lưu trữ tạm thời toán tử, toán hạng và xử lý dấu chấm động trong bộ nhớ. Long Mode được kích hoạt bởi HĐH, và đặc biệt là nó vẫn chạy được phần mềm 32bit và 16bit. Các ứng dụng 32bit này chạy ở Long Mode mà hoàn toàn không có ý thức về môi trường 64bit. Mặc dù vậy, những dịch vụ cơ bản của HĐH - như quản lý bộ nhớ, lưu trữ – vẫn xử lý dữ liệu ở 64bit và truy cập tới các thanh ghi mở rộng của Opteron. Đây là cách thức mà Opteron loại bỏ mọi trở ngại để mang lại ưu thế về tốc độ cho các ứng dụng 32bit chạy trong môi trường 64bit.

        Trong khi đó, Intel công bố kế hoạch đưa ra phần mềm mô phỏng giúp họ CPU 64bit Itanium của mình chạy các chương trình x86 (32bit) và cho rằng tốc độ mô phỏng sẽ tương đương với tốc độ của Xeon 1,5 GHz, tức là khoảng một nửa so với tốc độ lớn nhất hiện nay của Xeon và P4. Việc mô phỏng x86 không thể thực hiện được trên Alpha và PowerPC. Tuy nhiên, một sự mô phỏng hoàn thiện là khó có thể đạt được. Chính vì vậy, đây sẽ không phải là trở ngại đối với AMD.

    ĐƯỢC VÀ CHƯA ĐƯỢC

        Ngoài sự tương thích của Opteron còn nhắm vào nhiều đặc tính mới có trong các CPU khác. Đa kênh, bus I/O tốc độ cao, Dubbed HyperTransport, liên kết CPU đến bộ nhớ, ngoại vi và các CPU khác trên cùng một hệ thống. Đối với những thiết kế CPU khác, bộ nhớ và bộ điều khiển bus là những thành phần nằm ngoài; nhưng AMD lại tích hợp các chức năng này lên cùng lõi của chip xử lý, làm đơn giản thiết kế hệ thống. Bộ điều khiển trên chip cũng làm giảm thời gian gửi và nhận dữ liệu từ bộ nhớ và các thiết bị. Tốc độ I/O và thông lượng bộ nhớ là những chỉ tiêu rất quan trọng đối với các ứng dụng lớn, và chúng thường có ý nghĩa hơn là tốc độ tính toán.
        So sánh về cache L1 và L2, thông lượng bộ nhớ và một số đặc tả khác của Opteron được chỉ ra ở bảng.

        Một ứng dụng khác của Opteron là NUMA (nonuniform memory access – truy cập bộ nhớ không đồng nhất) nhằm mục đích tăng tốc khả năng truy cập bộ nhớ. Giống như Xeon và Athlon, chip Opteron bị hạn chế bởi 4GB bộ nhớ ở Legacy Mode. Tuy nhiên trong trường hợp này là 4GB cho mỗi CPU; hệ thống 2 CPU sẽ là 8 GB và 4 CPU sẽ là 16 GB. Khi chuyển sang Long Mode, hạn chế này bị phá vỡ và Opteron sẽ hỗ trợ tới 256 TB bộ nhớ ảo (1 terabyte = 1000 GB).

        Hai điểm trừ đối với Opteron là tốc độ cache và xử lý dấu chấm động. Tốc độ cache của AMD chậm hơn hẳn so với thiết kế của Intel, cả Xeon và Itanium 2 đều có khả năng tận dụng cache mức 3 (L3). May mà tốc độ truy cập bộ nhớ nhanh của kiến trúc NUMA đã bù lại phần nào.
        Các bộ xử lý của Intel và IBM đều vượt trội AMD về tốc độ xử lý dấu chấm động, là khả năng có vai trò rất quan trọng trong tính toán khoa học, kỹ thuật và các phần mềm multimedia. Tốc độ tính toán số nguyên của Opteron có thể so sánh được với các đối thủ 64bit, nhưng sự thua kém về xử lý dấu chấm động lại đặt AMD vào thế chiếu dưới, đặc biệt là khi IBM tung ra Power5 vào cuối năm nay và xuất hiện thế hệ tiếp theo của Itanium.
        Mục tiêu tiếp theo đối với các nhà chế tạo CPU sẽ là thiết kế đa lõi, cho phép đưa hai hoặc nhiều bộ xử lý riêng lẻ lên cùng một CPU chip. Chúng sẽ chia sẻ cùng một bộ nhớ cache tốc độ cao, không phải với ra các thành phần bên ngoài chia sẻ dữ liệu với các CPU khác. Hệ thống đa lõi như vậy sẽ có mật độ các phần tử rất cao vì phải tích hợp 4 hay 8 BXL trên một đế. Chúng sẽ tiêu thụ năng lượng ít hơn so với các BXL đứng riêng. Đa lõi sẽ là chuẩn trong 5 năm tới và chúng đang nằm trong kế hoạch đối với Power, Itanium và Sparc.
        Sự ra mắt chip 64bit của AMD không có gì là bất thường. Còn rất nhiều việc mà các chuyên gia công nghệ của họ phải bận tâm để bắt kịp công nghệ của các đối thủ khác như tốc độ cache, xử lý dấu chấm động, công nghệ đa lõi... Đương nhiên, trở ngại là rất lớn đối với AMD trước các đối thủ hùng mạnh.

    Tìm hiểu tốc độ cao

        Bộ I/O nhanh và giao tiếp bộ nhớ giúp Opteron khắc phục nhược điểm về tốc độ cache chậm
        1. Bus I/O Hypertransport tạo ra đường truy cập tốc độ cao tới bộ nhớ, ngoại vi và các BXL khác trên cùng hệ thống Hypertransport cũng giúp tăng tốc độ truy cập tới bộ nhớ bên ngoài.
        2. Bộ nhớ tích hợp và bộ điều khiển bus cho phép giảm độ trễ thông tin đến các thành phần bên ngoài.
        3. Opteron thừa hưởng cache L1 128Kb từ Athlon XP, nhưng lại có cache L2 gấp 4 lần, tới 1MB.

        4. Giao tiếp đôi trên chip và kiến trúc NUMA giúp tăng tốc độ truy cập đến bộ nhớ chính.

    Nhật Thanh
    Infoworld
    15/12/2003

    ID: A0307_87