【芯視野】高端GPU禁售傳聞聲起 BAT們遭遇緊張時刻

集微網報道(文/張軼羣)昨日,行業傳出消息稱AMD、英偉達中國區收到總部要求,將對中國客戶斷供部分型號的高端GPU芯片。

集微網向AMD、英偉達方面求證,雙方均表示不予置評。但後續有產業鏈消息顯示,互聯網廠商已收到相關通知,但目前屬於預溝通階段,AMD、英偉達總部仍在分析美國政府的政策要求,預計2-3天后會有明確消息放出。

考慮到一直以來美國對中國在超算等高性能計算領域的限制,此次傳聞並非空穴來風。據集微網瞭解,美國對於禁售中國高端GPU的計劃已醞釀半年時間。

此次禁售,與之前美國將中國超算機構、相關芯片企業拉入實體清單不同,而是通過禁售具備雙精度計算能力的高端GPU產品,與前不久針對中國14nm以下設備禁售、3nm GAA工藝EDA工具限制方式類似,意在某個技術節點或關鍵技術指標上做出封鎖,限制程度進一步升級,打壓範圍更加廣泛。

互聯網企業成爲此次制裁波及的主要對象。行業人士指出,互聯網廠商出於對性能等因素考慮,對國產CPU、GPU普遍接納度不高,此次事件應爲互聯網廠商預警,加速CPU、GPU等核心芯片的國產替代應受到重視,希望有助於互聯網廠商加速推進服務器核心芯片國產替代的導入和驗證,提升自主可控能力。

圍堵超算制裁收緊

近年來,因超算在氣象、軍事等方面體現出的戰略價值,以及中國在該領域能力的不斷提升,美國一直保持着對中國的限制和制裁。

2015年,鑑於天河一號、天河二號的出色表現,美國將中國國家超級計算長沙中心、廣州中心、天津中心和國防科技大學列入實體名單,開始實施對中國超算芯片的禁售;2019年,美國將海光、中科曙光等5家超算和芯片企業拉入實體清單;2021年年初,美國又將飛騰、申威等7家超算相關機構列入實體名單,年底則在實體名單中首次加入國產GPU企業景嘉微。

行業分析人士指出,此次兩家企業高端GPU產品禁售中國的可能性較大。美國發起的禁售通常會包括某些特定型號,從目前的消息看符合這一特徵,而且之前已有部分特定型號的產品有所限制,而在過去幾年美國也一直試圖阻止中國高性能計算領域(服務器CPU/GPU)的發展。

一位超算行業人士向集微網介紹,從2019年開始,應用於超算領域高端GPU售至中國就受到嚴格管制,但當時只是AMD產品受限,英偉達的產品並未受到影響。獲得銷往中國的許可需要通過美國白宮、商務部、國防部、能源部的共同批准,這一過程中,AMD曾經試圖通過軟件方面限制等方式獲得美國方面的許可,但一直未獲成功。

“前一陣的消息是美國方面鬆口,而且據瞭解AMD已經開始準備相關產品在中國的推廣,但現在看美國的限制政策似乎又突然收緊。”該人士表示。

互聯網企業受波及

在北京半導體行業協會副秘書長朱晶看來,從美國對我國超算的打擊和圍堵歷程可以看出,打擊方式和範圍來看都在逐步升級。

朱晶認爲,此次打擊的方式是從“超算相關單位進入實體清單”升級爲“可爲超算提供服務的相關產品直接禁售”,導致受影響的範圍從超算領域擴大到互聯網領域。

傳聞中涉及的AMD的MI100和MI200,英偉達的A100和H100都屬於高端GPU產品,針對企業客戶,數據中心應用,同性能目前並無國產替代產品。

一位行業人士指出,目前業界用於衡量超級計算的Linpack測試,主要指標爲“雙精度浮點運算能力”,即64位浮點數字的計算(FP64),而此次從傳言的禁售對象上看,都是具備雙精度(FP64)能力的高性能顯卡產品,對於半精度,單精度的GPU不受影響。

“此前,具備FP64能力的相關產品不被允許直接賣給中國的超算中心,但有規避途徑,以其他機構和實體的名義換個馬甲也能購買到,但此次更像是美國擔心中國互聯網企業買了之後用於超算服務,於是互聯網企業也不被允許。”該人士表示。

在朱晶看來,此次針對雙精度計算能力的高端GPU芯片禁售,並非針對GPU和企業,而是類似數日前美國針對中國14nm以下設備,3nm GAA工藝的EDA工具軟件的類似限制,在某個技術節點上採取封殺策略,而這樣帶來的影響面更廣。

“看似依然是對我國超算的進一步封鎖,但波及範圍已經遠遠放大,並且技術點的斷供還要考慮對上下游的牽連,會讓行業的痛感更強烈。”朱晶表示。

影響與應對

從目前AMD和英偉達兩家企業看,如上所述,AMD的相關產品正處於準備中國市場推廣的當口,英偉達的A100系列產品在中國擁有非常大的出貨以及衆多客戶,如果禁令施行,無論是對兩家企業還是中國的互聯網廠商都會產生較大影響。

朱晶分析稱,如果禁售傳言成真,未來英偉達和AMD可能會把不帶FP64的中國定製版(簡化版)產品賣給中國互聯網廠商,這相當於爲中國市場定製產品,涉及重新流片,同時也面臨庫存清出所帶來的成本挑戰。

在排除定製版的極端情況下,對於中國的互聯網廠商,可以通過購買兩家企業的中低端卡做組合,實現性能最優的方式解決問題。儘管通常情況下,成本並非互聯網廠商首要考慮目標,但對於成本超支仍有忍耐閾值,同時還要考慮在節能減排的背景之下能耗所帶來的影響。而這種情況,本身對AMD和英偉達的營收損傷也較大。

一位GPU行業人士告訴集微網,互聯網企業在計算數據中心整體成本支出時,在高端產品上,一次性購買成本、機架佔位/人工服務費(運維)、電費三者所佔比重大約爲3:3:4,如果按照傳聞所言,英偉達今年發佈的最先進的4nm工藝的H100被禁,只能採用12nm的V100產品,考慮到增加的機架費用、功耗增加所帶來的電費,整體而言將超過3倍的支出,如果再考慮到3-5年的運營週期,成本上將高出許多。

“而如果在超算領域,電費約佔運營費用的七成以上,整體成本支出也會變得更加昂貴。”該人士表示。

此外,也有觀點稱禁售將會對AI訓練的高端芯片產生影響,但有行業人士指出,目前這些產品的實際使用量不大,且大部分互聯網公司此前已有備貨。

GPU國產替代加速

近幾年,國內GPU企業受到空前關注。老牌CPU廠商如龍芯、海光等均實現上市,且在GPU領域尋求突破,龍芯中科自研GPU已首度亮相,海光的DCU(GPGPU)也逐漸打出知名度,此外,也涌現出一批頗具知名度的初創GPU企業。

行業人士看來,儘管目前,國內芯片公司並不具備實現FP64的技術能力,但如果美國斷供,將會利好國內GPU企業。

雲岫資本合夥人兼首席技術官趙佔祥就認爲這是對國產數據中心GPU的重大利好。

“計算芯片最大的門檻是軟件門檻,軟件用的人越多越穩定,芯片越好賣。美國倒逼中國客戶用國產GPU,國產生態一旦建立起來,即使美國再放開,也很難限制國產廠商。”趙佔祥說。

此外,百度等互聯網企業已經發布自研AI超算芯片產品,但存在與原CUDA生態的兼容問題,需要投入較長時間完善。海光DCU8系列Z100產品數據接近英偉達的MI100產品,同時兼容CUDA生態,被廣泛看好。

但有行業分析人士指出,目前海光DCU產品被互聯網公司實際採購較少,一方面此前市場上有性能更優的英偉達和AMD新款產品可用,互聯網企業購買國產芯片意願較低,另一方面海光DCU推出的時間較短,且大部分自供曙光的智算中心項目。

“無論傳言是否屬實,加速GPU的國產替代都是大趨勢,目前國產CPU、GPU主要應用於黨政信創市場,互聯網廠商出於對性能、功耗等因素考慮,對國產CPU和GPU接納度不高,此次事件有望爲互聯網廠商敲響警鐘,希望能夠加速推進服務器國產核心芯片的導入和驗證,提升國產化和自主可控的能力。”該人士表示。(校對/李映)