科大訊飛發佈首個基於純國產算力的深度推理大模型

經濟觀察網 記者 沈怡然 1月15日,科大訊飛(002230.SZ)推出了國內首個基於全國產算力平臺訓練的深度推理大模型X1。這既是科大訊飛在大模型能力上的突破,也是國產算力能力的突破。

AI的演進方向就是模擬人腦的認知和思維過程,使機器能夠更自然、更高效地處理信息和解決問題。深度推理模型是實現這一目標的重要工具之一。

在發佈會上,科大訊飛一位工作人員讓X1解一道數學題,X1模型能夠將複雜問題拆解爲多個步驟進行思考推理,並向用戶詳細展示思考過程。同時,X1模型如果在某一解題方法上遇到問題會重新規劃另一路徑。

深度推理能力也是ChatGPT演進的一個重要方向,GPT更新至3.5版本已經展現出相關能力,至4.0版本首次將輸入模態從單一文本擴展到圖文雙模態,顯著增強了解決複雜任務的能力。

不過,科大訊飛的X1模型並非業內首個,此前智譜AI、商湯科技、月之暗面都將基礎大模型完成了類似的升級。X1模型的特殊之處在於,它是首個在全國產算力上開發的大模型。

所謂全國產算力,主要是指基於國產GPU搭建的數據中心所提供的算力。目前,英偉達(NVDA.US)佔據全球GPU市場的90%份額,國內大型數據中心所用的GPU幾乎依賴進口。

科大訊飛表示,國產算力確實在單卡性能和生態上都與國際領先水平有差距,與華爲的合作也經歷了一番磨合與挑戰。在開發訊飛星火X1模型的過程中,他們開闢了一條全新的技術路徑,包括在訓練和推理過程中實現強交互和跨任務數據傳輸,促進了不同任務間的知識共享和高效協同,同時,他們克服了國產硬件在帶寬性能上的限制,確保數據傳輸的高效性和準確性。

這次合作爲國產算力提供了實踐機會,有助於實現國產算力從硬件到軟件的自主可控。合作也提升了國產大模型在政企服務中的信譽,隨着國家政策的引導,基於國產算力的大模型正成爲政府採購的首選。

沈怡然經濟觀察報記者

大科創新聞部記者關注硬科技領域,包括機器人及人工智能、無人機、虛擬現實(VR/AR)、智能穿戴,以及新材料領域。擅長企業深度報道及上市公司分析報道。發現前沿技術、發展趨勢投資價值。