大企業初煉大模型,數據是“攔路虎” | 海斌訪談
央企國企等大型企業成爲大模型落地的急先鋒。這些企業業務覆蓋寬廣,企業體量龐大。它們既可以爲大模型提供用武之地的豐富場景,又能支付起早期大模型落地的巨大成本。不過,隨着DeepSeek免費開源崛起,數據問題成爲阻礙大模型落地進程新的攔路虎。很多央企國等大型企業業務數據分散且格式多樣,需解決非結構化數據的清洗、標註和知識化問題。“大模型應用場景市場剛剛開始,目前的應用還是冰山一角。企業會先拿出邊緣性場景做嘗試,逐步走到核心場景,也會從一些局部的部門或者局部崗位開始嘗試,逐漸走到全部崗位,也就是所有系統都用大模型迭代。”亞信科技執行董事兼CEO高唸書對記者表示。
落地大企業大模型交付的業務,對衝了亞信科技傳統業務的下滑。三大通信運營商近年來縮減了對5G的投資,這直接影響亞信科技的相關業務。而另一方面,央企國企等大型企業正在積極搭建自己的大模型能力,這爲亞信科技的轉型提供了緩衝地帶。“垂直行業我們不想把攤子鋪得太大,也不想踩太多坑,所以風險控制方面會非常關注,因此會聚焦在兩個大的方向,一個是我們5G專網的應用,另外一個就是大模型應用交付。”高唸書表示。阿里巴巴、百度等企業的大模型是亞信科技向企業交付垂直產業模型的底座。2023年4月份,亞信科技跟阿里雲簽署合作協議,從當年6月份開始大量做場景部署。“大模型交付商機主要在能源、電力、航空、菸草、金融、政務、醫療這些大的領域。”高唸書對記者表示,“我們很多標杆案例,主要面向一些央企、國企。”央企國企等大型企業落地大模型,也是從最初簡單的問答、BI(商業智能)場景,逐漸做更深入的場景,比如亞信科技幫電網做的調度場景、網絡規劃等場景,以及航空領域的機務助手、零配件調度場景。中關村科金總裁喻友平同樣感覺到央企國企對人工智能的熱情,該公司專注垂類大模型技術與應用,拿到不少做垂類場景的央企國企訂單。亞信科技和中關村科金有相似之處。它們目前都不做基礎大模型,而專注於在基礎大模型之上,幫企業落地垂類大模型應用,成爲打通產業和模型的橋樑。大模型還在不斷迭代,落地過程尚處於探索階段。企業在落地大模型的過程中,都必須投入不菲的成本。算力底座是必需的花費,購買英偉達或者本土企業的算力卡,這就一筆高昂的開支。即便DeepSeek大模型,它的滿血版所需要的算力投入“也得好幾百萬”。而此前,企業還需要購買閉源大模型,據喻友平觀察,“大模型剛出來的時候,奇貨可居,上千萬價格都有”。這麼大額的投資,企業不得不考慮投資回報。“投多少,能掙多少錢,能節省多少成本?企業得算賬。”喻友平表示。在一些應用場景,比如智能營銷和客服,企業的賬目容易算出來,央國企和民企都願意落地場景垂類大模型應用,甚至民企積極性更大。智能客服就是中關村科金最主要的產品之一。但是在生產、研發和運維這些核心業務場景中,大模型如何發揮作用,企業還看不到清晰的圖景。“目前大家還在摸索階段,很多人還處在不知道怎麼做的階段。企業去算ROI(投資回報率),可能算不清楚,就只能算長期賬。”喻友平表示,“我覺得這就是央國企等大型企業的長處,它們基本盤大,敢於投入。在覈心的生產、研發等業務場景中投入大模型,它們更積極。”數據是難題DeepSeek把大模型價格打下來,企業落地大模型的成本低了。在大模型的價格戰中,大模型價格從千萬級下降。“後來百萬級別也很多,再後來就是200萬也賣、100萬也賣。”喻友平對記者表示,DeepSeek出來之後,一個顯著的變化就是,沒有人去買一個閉源大模型了,“模型成本直接降到零了”。“DeepSeek來了後確實對大模型交付工作產生了非常大影響,之前大廠提供的大模型基本上不會爲客戶提供微調和訓練的服務,因爲訓練一圈大概是千萬級以上投入,客戶一般支付不起。而且訓練需要海量數據,一般客戶私有數據也不具備這個數量級。”亞信科技副總裁、雲事業部總經理傅葳對記者表示。價格不是大模型落地企業唯一的攔路虎。大模型的能力日新月異。企業本身對於什麼場景可以用大模型,這個大模型怎麼用以及預期效果是什麼,會帶來什麼樣的新問題,這些方面的經驗都不充足。“在這裡面更重要一點就是企業的數據問題。”傅葳說,數據是大模型的前站,也是企業的核心資產。在人工智能浪潮裡,應用大模型的企業通常既沒有能力自產算力,更難以開發自己的基礎大模型,只有經年累月積累的業務數據是自己的,而且是核心秘密。企業擔心業務數據外流造成損失,所以大型企業往往願意本地化部署大模型。但這些數據通常是初級和粗糙的,難以直接投餵給大模型。如果企業內部沒有做過數據收集、整理、清洗,就很難一站式地部署大模型。“我們接觸很多客戶,他舉手說要做大模型,提出很多場景,但是我們入場第一站都還是幫助他做數據收集清洗,包括整理、標註這些工作。這些工作量比較大,也會帶來比較大的成本。”傅葳表示。這些工作都需要亞信科技、中關村科金等企業去做。“我們認爲大模型應用場景市場纔是剛剛開始,我們目前看到的應用還是冰山一角。”高唸書認爲,未來的石油、石化、機場等各個行業,都會有自己專業模型以及專有智能體。喻友平認爲,隨着越來越多的企業將大模型應用到核心業務中,企業大模型的勝負手不再是模型參數大小,而是誰更懂用垂類知識和經驗提升業務價值。垂類大模型作爲大模型進一步商業化的關鍵,已成爲企業數智化升級的必選項,無論是央國企還是民企,都一樣。