AMD正式發佈Zen5/5c架構EPYC 9005:384線程5GHz無敵!4倍性能碾壓對手

快科技10月11日美國舊金山現場報道:

Advancing AI 2024大會上,AMD正式發佈了第五代EPYC的第一波產品,EPYC 9005系列,代號Turin。

它基於全新的Zen 5、Zen 5c架構,規格、性能再次雙雙實現飛躍,即便是Intel正在陸續發佈的至強6系列也黯然失色。

一如消費級的銳龍,AMD EPYC這些年處理器在服務器與數據中心也是大殺四方,一代一代穩步向前,性能持續飆升,份額持續攀升,讓Intel的至強一直擡不起頭來。

實在難以現象,AMD只用了7年的時間,就取得了如此傲人的戰績,在一向最爲穩定的服務器和數據中心市場上硬生生撕開了一道口子。

按照第三方市調機構的統計,第一代Naples EPYC 7001系列誕生之時,也就是2017年的時候,AMD在服務器市場上的份額幾乎爲零。

加上第二代Rome EPYC 7002系列的連續積累,2020年時AMD已經收穫了8%的市場,初步站穩了腳跟。

之後,隨着第三代Milan EPYC 7003系列的到來,AMD迎來爆發階段,市場份額在2022年達到了驚人的27%。

第四代EPYC更是達到了空前的高度,市場份額也穩步增加,截止到2024年上半年已經佔到34%,也就拿下了三分之一的天下。

部署採納AMD EPYC的企業也越來越多,遍佈各個行業,這裡只是列舉了其中的一部分,看看你都認識誰?

大家都知道,第四代EPYC擴展出了前所未有的多條產品線,9004/8004/4004三大系列和各種分支(Genoa/Bergamo/Siena),全面覆蓋各個市場領域和應用場景。

第五代也必然延續這一趨勢,今天的EPYC 9005這是第一波,比如說新一代3D堆疊緩存就在後邊等着呢……

好了,接下來,我們就看看最新的EPYC 9005到底有多麼強大!

這一次,Zen 5、Zen 5c同時出擊,都劃分在了EPYC 9005系列之內,在覈心數、內存與PCIe連接上有所不同。

首先,製造工藝從5/6nm升級到了最新的3/4nm,晶體管多達1500億個,因此可以做到更高的集成度,以及更高的頻率。

Zen 5部分,CCD從12個增至16個(繼續搭配一個IOD),每個CCD內還是8核心,因此總數從96核心192線程增至128核心256線程。

Zen 5c部分,CCD從8個增至12個(也搭配一個IOD),而每個CCD內仍然是16核心,總計就是空前的192核心384線程。

Intel能效核版至強6雖然能在未來通過雙芯封裝做到288核心,但無法支持超線程技術,因此只有288個線程,大大落後於AMD,再考慮到AMD多線程技術的高效率,192核心384線程領先288核心288線程問題不大。

再說一遍,Zen 5c、Zen 5在架構上是完全一致的,IPC性能、ISA指令集毫無二致,比如都支持完整的AVX-512指令,前者只是三級緩存少一些、頻率低一些而已,操作系統和應用軟件都不需要特殊適配。

這與Intel性能核、能效核的異構架構完全是兩條路。

核心數量大增的同時,EPYC 9005系列的最高頻率首次做到了5GHz!相比於四代EPYC的最高值增加了足足900MHz,相當的不可思議。

當然,功耗不可避免地增加了,最高可以達到500W。

內存方面,最高還是12個通道、單路6TB容量,不過頻率從DDR5-4800提高到了DDR5-6400。

這一代新引入了"動態封裝後修復"(PPR),適用於x8/x4 ECC RDIMM,具體情況暫未公佈,猜測可以及時修復內存物理錯誤甚至缺陷,大幅提升穩定性。

I/O平臺連接方面,PCIe 5.0通道最多還是160條,新增了PCIe鏈接加密功能,並且從CXL 1.1+升級到CXL 2.0。

安全性方面,新增可信賴I/O(Trusted I/O),以及美國國家標準與技術研究院(NIST)制定的美國聯邦密碼模塊安全標準FIPS 140-3。

哦對了,EPYC 9005系列依然採用SP5封裝接口,無縫兼容EPYC 9004系列,Intel至強6則更換了LGA4710、LGA7529兩種新接口。

EPYC 9005全系型號、規格、價格一覽,一共有多達27款,包括22款Zen 5、5款Zen 5c,編號混在一起,確實不太容易區分。

Zen 5c的覆蓋96/128/144/160/192核心,每種一款,其中後三種是Zen 5c獨享的。

旗艦型號EPYC 9965,192核心384線程,384MB三級緩存,主頻2.25-3.7GHz,熱設計功耗500W,價格達14813美元,約合人民幣10.48萬元。

其他四款不再一一介紹,加速頻率都是3.7GHz,三級緩存都是384MB,功耗320-400W。

作爲對比,Zen 4c架構的128核心EPYC 97x4系列最高頻率才3.1GHz,三級緩存才256MB,當然功耗也低一些340-360W。

Zen 5的覆蓋8/16/24/32/36/48/64/72/96/128核心,其中72核心及以下只有Zen 5,96/128核心則是都有。

旗艦型號EPYC 9755,128核心256線程,512MB三級緩存,主頻2.7-4.1GHz,熱設計功耗500W,價格12984美元,約合人民幣9.19萬元。

而現有的對應96核心旗艦EPYC 9654最高頻率才3.7GHz,三級緩存384MB,功耗360W。

順帶一說,同樣128核心的至強6980P價格高達17800美元,約合人民幣12.60萬元。

可以跑到5GHz加速頻率的有兩款:

一是64核心的EPYC 9575F,基準頻率3.3GHz,三級緩存256MB,功耗400W;

二是16核心的EPYC 9175F,基準頻率4.2GHz,三級緩存則是旗艦之外唯二的512MB,功耗320W。

其他所有型號的加速頻率,也都在4GHz之上,確切地說都不低於4.1GHz。

性能方面,AMD宣稱EPYC 9005系列在企業、雲應用中的IPC提升最高爲17%,而在HPC、AI應用中的IPC提升最高更是達到驚人的37%!

當然,具體情況在AI應用中取決於特定場景的優化加速,很容易獲得更大幅度的提升。

接下來是官方性能對比,我們快速過一下。

192核心EPYC 9965對比128核心EPYC 9754在行業標準的SPEC CPU 2017整數性能對比中提升約60%,更是Intel 64核心五代至強8592+的足足2.7倍。

是的,沒有對比最新的至強6,因爲後者剛剛發佈,還沒有實際部署,也缺乏測試數據。

同樣的32核心,EPYC 9355對比EPYC 9354提升了將近30%。

當然最高頻率也從3.8GHz提高到4.4GHz,這部分理論上可以貢獻15%左右的提升幅度,另外至少一半來自架構改進。

對比五代至強6548Y+,則有40%的領先優勢。

再換個角度,同樣的核心數與成本下,EPYC 9575F代際提升約15%,對比競品領先60%。

在不同的企業應用、HPC、AI等負載中,包括視頻轉碼、圖像渲染、商業程序、數據庫、FEA(有限元分析)模擬、CFD(計算流體力學)模擬與建模、開源高性能計算、機器學習、端到端AI、相似性搜索、大語言模型等等,EPYC 9965都能做到遙遙領先。

它不但對比上代有着質的飛躍,對比競品64核心的至強8592+更是全程碾壓,性能優勢最高達4倍之多。

對於舊平臺更新換代,EPYC 9005系列更是上佳之選,比如從非常流行但老舊的二代至強鉑金8280升級到EPYC 9665,只需131臺服務器就能達到原來1000臺的性能水平,節省87%的佔地空間。

同時,功耗可以節省最多68%,三年TCO成本節省最多67%,非常划算。

CPU處理器搭配GPU加速器組成超高性能的AI計算系統,也是當下的潮流。

AMD 推薦使用64核心的EPYC 9575F/9554、96核心的EPYC 9655,搭配自家的MI300X、MI325X(剛發佈),都支持單路八卡。

性能上,EPYC 9575F對比至強8592+,訓練性能可領先20%,推理性能可領先8%,1000節點集羣每秒可以多處理70萬個Token。

當然,大量的NVIDIA GPU計算集羣都搭配着EPYC處理器,AMD也做了不同規模的最佳皮牌型號的推薦。

還是EPYC 9575F對比至強8592+,訓練性能可領先15%,推理性能可領先20%,還可以多處理20%的請求,並節省15%的時間。

這就是新一代EPYC 9005系列,依然是世界上最佳的雲服務、企業、HPC、AI處理器,擁有更先進的工藝、更多的核心、更高的頻率、更大的三級緩存、更高的性能、更高的性價比、無縫的兼容性。

Intel全新的至強6,此時也只能默默地嘆息一聲:既生瑜,何生亮。

接下來,我們更加期待第五代EPYC在更多的行業生根發芽、落地開花。