• Thứ Tư, 19/12/2007 06:59 (GMT+7)

    Penryn 4 nhân chưa bộc lộ sức mạnh

    Qua thử nghiệm, CPU Penryl 45nm của Intel chưa thể khuất phục thế hệ CPU trước nhưng công nghệ phía sau nó vẫn giúp Intel ngẩng cao đầu.

    Qua thử nghiệm, CPU Penryn 45nm của Intel chưa thể khuất phục thế hệ CPU trước nhưng công nghệ phía sau nó vẫn giúp Intel ngẩng cao đầu.

    Vừa xuất hiện một bộ xử lý (BXL) cao cấp cho máy tính để bàn, thuộc dòng CPU Penryn của Intel, là sản phẩm đầu tiên ứng dụng quy trình sản xuất 45nm do chính Intel phát triển, đó là BXL Core 2 Extreme QX9650. Dựa trên thử nghiệm PC WorldBench 6 với BXL 45nm Core 2 Extreme QX9650 3GHz so với Core 2 Extreme QX6850 3GHz 65nm, tốc độ của BXL 45nm chỉ hơi nhỉnh hơn (xem bảng). Tuy vậy, chưa có ứng dụng nào trong bộ công cụ thử nghiệm WorldBench tận dụng được tập lệnh SSE4 mới của QX9650. Tập lệnh này tăng tốc độ rất lớn các tác vụ như giải mã video trong các ứng dụng tận dụng SSE4 (điểm số do chính Intel đo được và những minh họa trong diễn đàn các nhà phát triển IDF tổ chức mùa thu vừa rồi ủng hộ cho khả năng này).

    Ngày càng nhỏ

    Lúc này, tin tức đáng giá là quy trình sản xuất 45nm mà Intel sử dụng cho Penryn sẽ giúp hãng tạo ra được những BXL cực nhanh cho thế hệ máy tính để bàn trong tương lai gần.

    Power Infinity Pro của
    CyberPower là hệ thống ðầu
    tiên PC World thử nghiệm
    với chip Intel 45nm QX9650
    Core 2 Extreme 3GHz.
    Dòng CPU Penryn chính thức công bố vào ngày 12/11, được sản xuất dựa trên một quy trình mới, thu nhỏ các tính năng của chip xuống chỉ còn 45nm (khoảng 1/18000 bề rộng của sợi tóc). Quy trình này rút nhỏ hơn nữa từ quy trình 65nm hiện Intel đang dùng cho dòng BXL Core và từ quy trình 90nm cho dòng Pentium 4. Hãng cũng đã minh họa quy trình 32nm dự kiến sẽ bắt đầu đưa vào sản xuất chip trong vòng 2 năm tới.

    Bằng cách thu nhỏ kích thước transistor trên chip, Intel có thể đưa ra nhiều CPU từ cùng một lượng silicon, hoặc tạo ra nhiều chip có độ phức tạp cao hơn trên cùng một diện tích. Ví dụ, BXL Celeron 300 sản xuất hồi năm 1995 sử dụng quy trình 250nm, có diện tích 131mm2 và chỉ chứa 7,5 triệu transistor; Core 2 Duo 65nm hiện thời có diện tích lớn hơn 11mm2 nhưng chứa đến 291 triệu transistor và BXL mới 45nm 4 nhân Core 2 Extreme QX9650 có diện tích 214mm2 nhưng chứa đến 820 triệu transistor.

    Tiếp bước

    Bộ xử lý Penryn cho máy tính
    để bàn đầu tiên, Intel QX9650
    Core 2 Extreme chạy ở xung
    nhịp 3GHz.
    QX9650 là chip Penryn cho máy tính để bàn đầu tiên có 4 nhân, phần lớn hướng đến người dùng đam mê tốc độ, muốn sở hữu đầu tiên (CPU này không khóa tính năng ép xung). Hiện tại, hầu như chỉ có vài game và ứng dụng audio hoặc video cao cấp tận dụng được hơn 2 nhân BXL nên chiến lược của Intel đối với CPU này vẫn còn ở tầm khác. Người dùng phổ thông sẽ phải chờ đến năm sau thì mới có được CPU 2 nhân sản xuất với quy trình 45nm. Còn lúc này, Intel vẫn chưa tiết lộ chính xác giá của QX9650 nhưng nếu có thì cũng không phải rẻ, dự đoán trên 1000USD, giống như 2 CPU đang dẫn đầu hiện nay là Core 2 Extreme QX6850 và QX6800 có giá trên dưới 1000USD (đầu tháng 10).

    Giống như kiến trúc 4 nhân hiện thời của Core 2 Extreme, QX9650 thực sự là 2 CPU 2 nhân nằm chung một gói silicon đơn với giao tiếp bus chia sẻ, trong trường hợp này bus chạy ở 1333MHz. Mỗi CPU 2 nhân có bộ đệm cache L2 6MB chia sẻ, trước đây QX6850 có cache L2 4MB cho mỗi nhân, do đó, tổng cộng QX9650 có cache L2 đến 12MB. Bộ đệm L2 lớn hơn phần lớn để đáp ứng cho số lượng transistor lớn của bộ xử lý mới.

    Tốc độ

    Nhờ vào một vài tinh chỉnh và tối ưu hóa như xử lý phân chia nhanh hơn và có đệm L2 lớn hơn nên kết quả do chính Intel đo được khi hãng giới thiệu trong diễn dàn IDF (Intel Developer Forum) diễn ra hồi đầu năm cho thấy tốc độ của Penryn trội hơn so với các BXL thế hệ 65nm chạy cùng xung nhịp, cũng như tiết kiệm được một phần điện năng.

    Asus Maximus Formula là một trong
    vài bo mạch chủ nền X38 hỗ trợ Penryn,
    chạy với bộ nhớ DDR2 mặc dù chipset
    hỗ trợ cả DDR3.
    Để xem Penryn có gì hơn khi chạy với các phần cứng, phần mềm hiện thời, nhóm thử nghiệm (NTN) thiết lập một hệ thống thử nghiệm với bo mạch chủ Asus Maximus Formula nền X38, bộ nhớ DDR2-800 2GB, cặp ổ cứng Seagate ST3320620AS 320GB thiết lập ở RAID 0 (striped array) và card đồ họa EVGA GeForce 8800GTS; so sánh QX9650 và QX6850 bằng công cụ WorldBench 6 beta 2.

    QX9650 trội hơn chỉ 1 điểm - 127 so với 126. Trong hầu hết ứng dụng thử nghiệm, BXL mới nhanh hơn khoảng từ 2% đến 5% nhưng lại chậm hơn khi chạy Nero và đặc biệt WinZip lại bị bỏ khá xa. Mặc dù điểm số này không vượt được 5 hệ thống dẫn đầu của PC World Mỹ nhưng cũng phải xét đến card đồ họa và thiết lập ổ cứng của hệ thống thử nghiệm không phải là tốt nhất. Như đã đề cập, không có ứng dụng nào trong bộ thử nghiệm WorldBench 6 beta 2 được tối ưu để tận dụng được tập lệnh SSE4 mới (Streaming SIMD [Single Instruction, Multiple Data] Extensions 4) và chỉ có một vài ứng dụng WorldBench có thể tận dụng nhiều hơn 2 nhân.

    Kết quả thử nghiệm của chính Intel đưa ra ngày 28/10 vừa qua cũng như những demo tại IDF mùa thu vừa rồi cho thấy tốc độ cải thiện hơn rất nhiều đối với những ứng dụng được tối ưu cho SSE4, như chương trình mã hóa DivX được tối ưu cho HD.

    Kiến trúc

    Mặc dù sử dụng cùng loại socket LGA775 như các BXL để bàn khác gần đây của Intel nhưng Penryn không hoàn toàn tương thích với bo mạch chủ. Intel cho biết chỉ đảm bảo Penryn chạy ổn định trên các nền chipset P35 và X38, không cho những dòng chipset cũ hơn như 975X và 965. Tuy vậy, các nhà sản xuất bo mạch chủ như Gigabyte đang làm việc để nới rộng khả năng hỗ trợ.

    Ví dụ, theo Gigabyte, các bo mạch Gigabyte nền P35, G33 và P31 sẽ chạy được CPU mới sau khi cập nhật BIOS. Và NVIDIA cho biết dòng bo mạch nForce 600i cũng như các dòng bo mạch chipset GeForce 7150 và 7100 cũng sẽ chạy được với CPU Penryn.

    Intel đang thúc đẩy DDR3 trở thành bộ nhớ chủ đạo cho CPU 45nm và đang đẩy mạnh hỗ trợ loại bộ nhớ này (cũng như DDR2) trong nhiều chipset gần đây. Tuy nhiên, giá cao và tốc độ cải thiện không nhiều của DDR3 khiến nhiều nhà sản xuất bo mạch chủ vẫn thiết kế các bo mạch X38 của họ chạy với DDR2. Thậm chí bo mạch chủ cao cấp Asus Maximus thử nghiệm trong bài được trang bị cả hệ tải nhiệt nước tích hợp cho chipset vẫn dùng DDR2. Vài bo mạch chủ khác như Asus P5KC hỗ trợ cả 2 loại bộ nhớ.

    Cũng có vài PC thương mại chạy Penryn đầu tiên như Power Infinity Pro của CyberPower (thử nghiệm trong bài) dùng với bo mạch nền chipset Intel P35.

    Cạnh tranh

    AMD tụt lại so với Intel trong cuộc chạy đua thu nhỏ kích thước tấm bán dẫn (die), tự đặt mình vào những bất lợi về quy mô sản xuất CPU. Mặc dù bị chậm so với đối thủ nhưng CPU Athlon của hãng cũng đã có doanh thu rất tốt nhờ vượt về tốc độ so với sản phẩm của Intel trong vòng 3 năm, bắt đầu từ 2003. Sự thống trị về tốc độ của Athlon chấm dứt đột ngột vào mùa hè 2006, khi Intel đưa ra dòng Core 2 mặc dù CPU của AMD vẫn cạnh tranh rất mạnh về tiêu tốn điện năng.

    Ưu thế tài chính của việc thu nhỏ kích thước die là rất lớn. Theo IDC, đây chính là cách làm truyền thống của Intel. Thu nhỏ kích thước die cho họ nhiều lợi thế về giá và chủ động chiếm thế thượng phong so với đối thủ trên thị trường bất cứ lúc nào.

    AMD không ngồi yên trong khi Intel cải tiến. Theo AMD, tháng 12, người dùng sẽ có được bộ xử lý để bàn 4 nhân Phenom dựa trên nhân Stars mới, trong đó có hỗ trợ bus Hyper Transport 3 và bộ nhớ DDR2-800, cộng với các tính năng tương tự Opteron như cache L3 chia sẻ. Công bố mới nhất của AMD là chip Phenom 3 nhân 65nm sẽ xuất hiện vào đầu năm sau. Nhìn chung, con số 3 không phù hợp mấy trong một ngành công nghiệp dựa trên cấp số 2 nhưng với ứng dụng hỗ trợ trên 2 nhân vẫn còn hiếm, AMD tin rằng BXL 3 nhân có thể chạy tốt như các BXL 4 nhân trong nhiều trường hợp. Và tùy chọn 3 nhân này cho AMD cách sử dụng chip 4 nhân với một nhân giả, hoặc 1 nhân không kích hoạt để nhắm vào tầm giá thấp hơn.

    Không may, AMD vẫn chưa tung ra Phenom - 4 nhân, 3 nhân hay cái gì khác - để thử nghiệm nên chúng ta chưa thể biết chúng bắt kịp những sản phẩm mới nhất của Intel hay không. Mặc dù không có tập lệnh SSE4 nhưng thiết kế và chi tiết kỹ thuật của chúng cho thấy sẽ cho tốc độ tốt. AMD cũng bắt đầu khai thác những phương pháp kết nối GPU và CPU như là một cách để cải tiến tốc độ chạy đa phương tiện.

    Điều này có nghĩa gì?

    Hiện thời, hầu hết người dùng chi có được chút ưu thế khi nâng cấp lên Penryn - BXL này có thể chưa tương thích với bo mạch chủ của bạn, thị trường còn ít ứng dụng được tối ưu cho tập lệnh SSE4 và chắc chắn là giá sẽ rất đắt; kể cả những lời đồn đại về chipset mới. Vì vậy, trừ khi bạn muốn là người sở hữu đầu tiên công nghệ mới, hãy chờ vài tháng cho đến khi thị trường định hình.

    PC World Mỹ 12/2007

    ID: A0712_12