微軟 Azure 推出全球首個定製英偉達機架
Nvidia 的 Blackwell 處理器 如今是最受歡迎的數據中心硬件之一,因爲各公司正在努力用數量越來越多的參數訓練大型語言模型 (LLM) 。據傳,微軟是首家獲得 Blackwell 服務器的公司,但這屬於非官方消息。今天,該公司表示,它不僅獲得了 Nvidia Blackwell 部件,而且已經啓動並運行。
因此,微軟 Azure 至少有一個基於 GB200 的服務器機架,其中 B200 處理器的數量未知,估計約爲 32 個。它使用了高度複雜的液冷系統。這臺機器不是英偉達的 NVL72 GB200,據報道,微軟更喜歡這種,而不是密度較低的變體。這個特定的機架可能會用於測試目的(包括英偉達 Blackwell GPU 和液冷系統),而且在未來幾個月,微軟將爲商業工作負載部署基於 Blackwell 的服務器。
預計配備 72 個 B200 圖形處理器的 NVL72 GB200 機器將消耗並散發約 120 千瓦的功率,這使得此類機器不得不採用液冷。因此,微軟在部署基於布萊克威爾的機櫃之前,測試其自身的液冷解決方案,這是個好主意。
就 FP8/INT8 性能而言(4500 TFLOPS/TOPS 對 1980 TOPS),英偉達的 B200 GPU 的性能相比 H100 處理器要高出 2.5 倍。在 FP4 數據格式下,英偉達的 B200 能提供高達 9 PFLOPS 的性能,爲訓練極其複雜的大型語言模型敞開了大門,從總體上能夠爲人工智能帶來新的使用模式。
“我們與 NVIDIA 的長期合作伙伴關係以及深度創新繼續引領行業,爲最爲複雜的 AI 工作負載提供動力支持,”微軟首席執行官薩蒂亞·納德拉在另一則 X 帖子裡說道。