訊飛星火發佈深度推理模型X1,全國產算力平臺訓練有多大含金量?
1月15日,科大訊飛發佈深度推理大模型訊飛星火X1,其表現最爲突出的是中文數學能力,目前已應用於教育和醫療場景。
在科大訊飛研究員的演示中,訊飛星火X1展現出了對複雜問題多步拆解的“思維鏈”能力,自我反思能力,並能夠針對答案正確與否等反饋信息進行強化訓練。
在小初高/大學(含競賽)、AIME、MATH 500等多項測試中,訊飛星火X1得分高於多個同樣強調多步思維能力的模型,其中包括月之暗面的K1。
值得注意的是,訊飛星火X1是國內目前全量開放可下載大模型中,唯一在全國產算力平臺上訓練完成的。
此次訓練任務是由科大訊飛與華爲合作完成。2023年10月,科大訊飛就曾聯合華爲推出國產萬卡規模大模型算力平臺“飛星一號”,並於去年10月再次宣佈啓動國產超大規模智算平臺“飛星二號”。
事實上,科大訊飛對於算力平臺的搭建一直圍繞國產算力。科大訊飛研究院院長劉聰曾在接受採訪時坦言,訊飛的算力規模不及頭部大廠,並且使用國產算力平臺,也需要花費不少額外精力進行適配等工作。
他表示,在國內芯片和算力集羣相較於國外領先水平有一定差距的情況下,訊飛的堅持仍然做出了可觀的效果。
算力成本是國內通用大模型堅持迭代升級的一個重要門檻。隨着Scaling Law的技術曲線放緩,更大算力投入與所獲性能提升的比例開始縮小,這意味着算力的“性價比”開始下跌,除非不顧成本,否則很難有大模型公司能夠繼續攻堅大參數模型的預訓練。
日前,作爲大模型“六小虎”之一的零一萬物就公開表示放棄超大模型的預訓練,轉向務實的、小而快的,以商業性價比來評估的模型。
如此可見,面對海外AI芯片高企的價格成本,以及日趨嚴格的購買限制,國產超大規模算力平臺很可能是未來大多數通用模型及產業模型的主要選擇之一。不過,缺乏生態支持、單卡算力有限等依然是國產算力長期面臨的問題,就超大智算平臺的搭建而言,行業還需要通信傳輸技術等AI基礎設施層面的能力提升。
在這場發佈會上,科大訊飛還發布了訊飛星火4.0 Turbo的更新版本,重點在於圖文、數學和長文本能力,在多模態能力水平上進一步接近GPT-4o。
圖文識別能力方面,該模型對通用文檔版面分析、文字識別的準確率相對提升了40%,複雜表格結構、潦草手寫文字等方面的準確率相對提升了60%。模型還加入了混域知識搜索技術,可以更準確分析不同領域的文本內容,提高一次性提問的信息搜索效率。
此外,科大訊飛還推出了星火語音同傳大模型,具備端到端語音到語音同傳能力,最快實現5秒同傳時延,接近人類專家譯員水平。
無論是深度推理大模型訊飛星火X1,新版訊飛星火4.0 Turbo,還是星火語音同傳大模型,科大訊飛都在強調其落地應用的實際場景與價值。
目前,訊飛星火X1已應用於教育和醫療場景。除了訊飛自己所擁有的核心業務對應的行業資源,還有其智能硬件終端AI學習機。星火語音同傳大模型也明確計劃應用於訊飛錄音筆、訊飛翻譯機、訊飛辦公本。
這是相較於其他創業公司,科大訊飛大力投入AI大模型的差異化之處,這家公司自身擁有大量的落地場景,包括ToB(企業端)業務資源,以及智能硬件終端場景。
據科大訊飛此前披露,2024年1-9月,公司在中國大模型招投標市場成功中標38個項目,披露的中標金額爲2.16億元,在項目數量和金額上均爲行業第一。
作爲上市公司,科大訊飛在AI大模型上的投入也將受到投資人們的持續關注與質疑。
2024上半年,科大訊飛虧損4億元,上年同期則盈利7357萬,這是其上市以來首份虧損的半年報。其中,2024上半年圍繞大模型相關的總投入超過13億,包括圍繞大模型新增1.2億營銷推廣費用。上半年的研發總投入高達21.9億,同比增長32.32%。
彼時,公司董事長劉慶峰明確表示,要剔除不盈利的小業務,把戰略業務做得更大。
隨後,虧損情況到去年第三季度有所好轉。財報顯示,公司2024年前三季度實現淨虧損約3.44億元,同比下降445.91%。第三季度實現淨利潤5696.14萬元,同比增長120.87%,相比於前兩季度,單季度淨利潤與增速都實現了轉正。
其中,公司前三季度教育業務收入同比增長22%,學習機銷量增長超過100%,開放平臺與消費者業務中的智能硬件收入增長41%。
當前,科大訊飛對於AI大模型商業化路徑已規劃明確。首先是在消費者、教育、醫療、汽車等已有場景中加快規模化落地,其次是通過大模型與運營商、金融、能源、交通等行業與央國企戰略合作,第三是以會議、文檔、翻譯等標準化產品實行企業級銷售。
這家公司在AI大模型的訓練及應用方向選擇上都極爲務實。
科大訊飛研究院院長劉聰曾表示,訊飛的大語言模型會堅持迭代,o1大模型、多模態交互、語音端到端等方向均在計劃內。
科大訊飛高級副總裁江濤則表示,未來幾年公司不會在經營上額外大幅增加算力帶來的重資本投資。同時,公司探索AGI過程中各個階段的大模型成果,會通過蒸餾裁剪等各種技術手段沿途產出,落地到訊飛星火各個尺寸的大模型中,提高訊飛星火的商業化競爭力。