美國初創公司激光技術欲拯救地球和省千億
帶寬限制在人工智能和高性能計算(HPC)領域已成爲一個重大瓶頸
由於帶寬限制,GPU 未被充分利用,其近一半的計算能力都被浪費掉了。
預計英偉達要等到 2027 年“魯賓超”GPU 計算引擎推出時,纔會爲其 NVLink 協議推出光互連。
這一延遲致使超大規模企業和雲構建商探尋通過更早採用光互連來超越英偉達技術的辦法。
Xscape Photonics,一家由哥倫比亞大學的研究成果衍生出的光互連公司,正在藉助光子學來達成可擴展、高帶寬、能源可持續且成本效益高的解決方案,以支持下一代人工智能、機器學習和模擬硬件。
這能夠幫助人工智能行業節省數十億美元被浪費的 GPU 容量,同時也爲更綠色、更可持續的人工智能基礎設施提供了一條途徑。
下一個平臺 最近對 Xscape Photonics 進行了更深入的研究,並與其背後的團隊進行了交流,包括首席執行官 Vivek Raghunathan,他曾是麻省理工學院的研究人員和英特爾工程師。
Raghunathan 強調了當前 GPU 系統效率低下的情況,解釋說隨着規模的不斷擴大,問題從 GPU 設備級性能轉變爲系統級網絡問題。
這便是 Xscape 技術大顯身手之處。通過在 GPU 內部直接把電信號轉化成光信號,Xscape 可以顯著增加帶寬,同時降低功耗。
這家初創公司的解決方案叫做“ChromX”平臺,使用一種激光,能夠通過單根光纖同時傳輸多個波長的光,多達 128 個不同的波長(或“顏色”)呢。跟僅使用四個波長的激光相比,這能讓帶寬增加 32 倍。
ChromX 平臺還依賴於諸如 NRZ(非歸零)這樣更爲簡單的調製方案,與其他系統(如 InfiniBand 和以太網)所使用的高階方案(如 PAM-4)相比,其延遲得以降低。ChromX 平臺是可編程的,允許其調整波長數量以匹配 AI 工作負載的特定需求,無論是用於訓練還是推理任務。
拉古納坦對下一個平臺的蒂莫西·普里克特·摩根說:“願景在於使封裝內通信帶寬與封裝外通信逃逸帶寬相匹配。而且我們覺得,當採用我們的多色方法時,能夠實現這一匹配,從而讓大型數據中心——或者多個數據中心——表現得如同一個大型 GPU 一般。”
這項技術的潛在影響是巨大的。人工智能工作負載消耗大量能源,並且預計到 2035 年數據中心需求將增至三倍,電網可能難以跟上。Xscape Photonics 的創新可能提供一個至關重要的解決方案,使人工智能系統能夠更高效和可持續地運行。