決戰大模型,九死一生
撰文 |王長勝
今日凌晨,備受行業關注的首批大模型產品獲批名單終於出爐。一共八家:百度(文心一言)、抖音(雲雀)、智譜AI(GLM)、中科院(紫東太初)、百川智能(百川)、商湯(日日新)、MiniMax(ABAB)、上海人工智能實驗室(書生)。而之前熱傳的阿里通義千問、360智腦、訊飛星火均不在列。
百度官方公衆號第一時間發佈推文,稱“文心一言向全社會開放”,王小川的百川智能和商湯也隨即宣佈面向全社會開放服務。
這八家公司獲批的大模型產品都屬於AIGC,即“生成式AI”,主要面向C端用戶,由於涉及用戶數據安全,正式上線前需要進行算法備案,並向相關部門申報安全評估,所以纔有了“獲批”一說。
說是“百模大戰”,其實遠遠不止100家,目前公開數據可查的開發大模型的公司或者機構,少說也有幾百家,如果算上那些基於大模型開展業務的初創公司,“千模大戰”都不止。
去年年底,大模型的出現迅速燃爆了整個AI行業。當時,沒有投資人不在研究這個賽道,但是,大半年之後的今天,投資人們變得相當謹慎。
這是一場萬人搶奪獨木橋的賽道,成功的概率極低。比當年團購行業的“千團大戰”有過之而無不及。最後,活下來的只有美團,還是轉型做外賣才起死回生。當年的電商也一樣,各家巨頭都推出電商平臺,創業公司更是比比皆是,到最後,也只活下來三五家而已。短視頻、直播,莫不如此。大模型之戰,恐怕也會是這個結局。
中國大模型賽道似乎不信這個邪。從之前的報道可以看出,不管有沒有“自研”的大模型,大都號稱自己做大模型,哪怕只是套了一個殼,也都喊個“大底座”的故事。
下面我們就來盤點一下比較熱門或者說比較受關注的幾家大模型公司,看看他們的優勢和劣勢。
華爲盤古:不作詩,只做事
這兩天,華爲MATE 60喜提了不少熱搜頭條,國產替代大有可爲,不得不說,華爲在通訊領域的技術、人才儲備的深度和厚度是真的過硬。
以華爲的技術實力,大模型之戰一定不會錯過。而且,盤古有個口號叫做“不作詩,只做事”。
在AI大模型領域,華爲也已經佈局兩年。2021年4月華爲正式發佈盤古系列大模型,包括NLP、CV和科學計算大模型,後續還發布了礦山、藥物分子、氣象、海浪等行業大模型。今年7月7日,盤古大模型3.0正式發佈,這是一個完全面向行業的大模型系列,包括5+N+X三層架構。
L0基礎大模型:包括自然語言大模型、視覺大模型、多模態大模型、預測大模型、科學計算大模型在內的5個基礎大模型。
L1行業大模型:涵蓋N個行業大模型,既可以提供使用行業公開數據訓練的行業通用大模型,包括政務,金融,製造,礦山,氣象等;也可以基於行業客戶的自有數據,在盤古的L0和L1上,爲客戶訓練自己的專有大模型。
L2場景模型:爲客戶提供更多細化場景,它更加專注於某個具體的應用場景或特定業務,爲客戶提供開箱即用的模型服務。
從盤古大模型的佈局來看,華爲在各個行業的確有着足夠的經驗積累,盤古能夠相對精準地解決單個行業的問題。缺點是,由於盤古大模型是由多個百億級參數的行業大模型疊加在一起構成的,所以,它的通用算法能力不夠強。另外,雖然盤古號稱是參數最大的行業大模型,但是參數的稀疏性卻是個問題。
嚴格意義上來講,盤古大模型並不是一個真正的大語言模型,生成式能力不足的結果是“作不了詩,只能做事”。它不在首批獲批名單之列,也在情理之中。但是盤古的綜合實力和華爲的技術儲備,都讓任何從業者不敢不恭而敬之。
騰訊混元:真正的“私人訂製”
2022年底,騰訊發佈了低成本、可落地的NLP萬億大模型——混元(HunYuan)AI大模型,完整覆蓋NLP大模型、CV大模型、多模態大模型、文生圖大模型及衆多行業/領域/任務模型。
在產業化方面,混元先後支持了包括微信、QQ、遊戲、騰訊廣告、騰訊雲等衆多產品和業務,通過NLP、CV、跨模態等AI大模型,不僅爲業務創造了增量價值而且降低了使用成本。
特別是其在廣告內容理解、行業特徵挖掘、文案創意生成等方面的應用,在爲騰訊廣告帶來大幅GMV提升的同時,也初步驗證了大模型的商業化潛力。
騰訊混元的研發路徑,比較與衆不同。比如阿里和百度,都是先做模型,再找應用;先把通用性做起來,再去找行業輸出。混元的研發路徑是,先從騰訊各個業務線抽調人,沒有形成一個完整的、成建制的團隊,更像是一個鬆散的、虛擬化的工作組。抽調上來的人根據各自的業務可能用到的場景提煉出需求,然後,把這些需求整合到一起,開發出一個大模型。
這樣做的好處是,混元能夠在短期內做出來,而且天然地與騰訊業務結合的比較深、比較寬。缺點就是目的性較強,功能略顯泛化,對自家應用的改造和升級有一定幫助,但是對外的產業化能力比較弱,不是一個面向行業的大模型。未來,要想在“百模大戰”中贏得一席之地,有一定難度。混元不是一個天生能打的產品,更像是爲騰訊自己私人訂製,通過混元優化旗下的各個應用。
混元不是一個天生能打的產品,也不是一個通用型大語言模型,更像是爲騰訊自己做的私人訂製,通過混元優化旗下的各個應用。不在首批獲批名單,亦在情理之中。
阿里通義:不好不壞的自研大模型
2022年9月,阿里達摩院發佈通義大模型系列。該模型打造了AI統一底座,並構建了通用與專業模型協同的層次化人工智能體系,首次實現模態表示、任務表示、模型結構的統一。
通義大模型整體架構分爲三個層次:模型底座層:多模態統一底座模型M6-OFA,實現統一的學習範式和模塊化設計;通用模型層:多模態模型“通義-M6”、NLP模型“通義-AliceMind”以及CV模型“通義-視覺”;行業模型層:深入電商、醫療、法律、金融、娛樂等行業。
在今年7月的2023世界人工智能大會上,阿里宣佈推出通義大模型家族新成員“通義萬相”。這是一款AI繪畫模型,支持文生圖等功能,它能夠通過機器學習和自然語言處理技術,從文本描述中生成對應的圖片或畫作。
阿里雲做的很早,但是阿里大模型做的卻不算早。最早也不叫通義,後來兩三個模型拼在一起,取名通義,由達摩院負責。衆所周知,阿里架構調整,達摩院也受到波及。雖然,達摩院看着有上千號人,除去支撐內部各條業務線和外部服務的人,能夠專注於開發大模型的核心團隊也就那麼幾個人。從人力資源投入密度來說,通義不如其他幾家大模型公司。
另外一個問題是延續性問題。分拆前後,通義原負責人楊紅霞離職(後來去了字節跳動),負責自然語言處理的司羅,負責機器學習的賈揚清也相繼離職。多位P10級以上的AI大神的離職,導致後來的通義略顯拼接感。這也是最近一段時間,爲什麼通義在市場上的聲量並不大的原因。
當然,有個例外,釘釘併入阿里雲這三年,卻沾了不少AI的光。這也是再次獨立之後的釘釘敢於“後退一步”,做底層、做平臺、做插線板的底氣。
不管怎樣,阿里的通義大模型確實還算是國內少有的自研大模型之一。而且,阿里雲在決定大模型的三大維度——算力、算法和數據中的算力和數據方面,有着一定的優勢。未來,阿里雲要獨立融資,IPO,通義大模型會有望獲得重視和投入。尤其在To B的賽道上,通義大模型綁着阿里雲,資源還是深厚的。
百度文心:厚積薄發,終於等到你
十年磨一劍,苦盡終於要甘來了。
說起來可能很多人不信,當“人工智能”對大部分人還是陌生詞語的2010年,百度就已經開始全面佈局人工智能了。在2017年,百度首屆AI開發者大會上,創始人李彥宏更是直接喊出了“All in AI”的口號。
作爲國內少有的戴着純正技術光環的創始人,李彥宏對技術有着一種執念,時間久了,執念就會變成了信仰。
雖然,百度在移動互聯網階段被AT超越,但風水輪流轉,潛伏多年的AI終於在“生成式大模型”的熱潮中重回聚光燈下,成爲全球科技領域的當紅炸子雞。百度文心大模型也終於等到屬於自己的春天。
正是由於常年馬拉松式的鉅額投入(已投入超過1400億元),百度成爲了全球爲數不多的全棧佈局且每層都有領先產品和關鍵自研技術的頂尖AI公司。所謂全棧,指的是IT技術棧,可分爲“芯片層、框架層、模型層、應用層”四層。
在芯片層,百度崑崙芯科技已實現兩代通用AI芯片“崑崙”的量產及應用,爲大模型落地提供強大的算力支持。
在框架層,“飛槳”是國內首個自主研發的產業級深度學習平臺,集基礎模型庫、端到端開發套件和工具組件於一體,有效支持文心大模型高效、穩定訓練。
在模型層,文心大模型包括基礎大模型、任務大模型、行業大模型三級體系,全面滿足產業應用和廣大用戶的需求。
在應用層,文心大模型不僅應用於百度自有業務的各類產品,並通過企業級平臺“千帆”進一步推動生態構建,賦能千行百業。
此次被列入首批名單的文心一言底座的文心大模型,目前,已經迭代至3.5版本,與3.0版本相比,訓練速度提升了3倍,推理速度提升了30倍。
不同於其他行業垂類大模型(訊飛星火基本等同於教育大模型,華爲盤古只做少數幾個關鍵行業),百度文心大模型秉持“從產業中來,到產業中去”,基本實現了從通用到垂直的全面覆蓋。
百度還宣佈,要用文心大模型把百度所有的產品都重構一遍,對,是重構,不是騰訊那種優化。
在算力、算法和數據方面,百度也是國內大模型企業中實力最雄厚的,這一點,毋庸置疑。
正所謂,思維決定命運。AI原生思維決定了大模型時代企業能取得的成果,當其他大模型玩家還在解決垂類行業問題的時候,百度真正在用大模型能力和AI原生思維重構業務線,把大模型能力用到了服務上億用戶的產品中去,可以說,已經拿到下一個時代的入場券。
訊飛星火:我有一個夢想
在所有大廠裡,科大訊飛研發大模型是相對較晚的。
2022年12月15日,科大訊飛啓動“1+N”認知智能大模型專項攻關,2023年5月6日訊飛星火認知大模型正式發佈,涵蓋了文本生成、語言理解、知識問答、邏輯推理等七項核心能力。並於6月9日、8月15日持續迭代。星火認知大模型主要應用於教育、辦公、汽車駕駛、數字員工等場景。
在教育領域,訊飛星火認知大模型+學習機,可以AI寫作批改、精細批改、給優化參考,儼然成爲學生的智能家庭教師。在辦公領域,訊飛星火大模型+辦公(訊飛聽見、訊飛智能辦公本),可以自動會議紀要、自動語篇規整、一鍵成稿。在汽車駕駛領域,訊飛星火認知大模型+智能座艙,可以提供多輪、多人、多區域、多模態智能汽車人機交互範式,強化智能座艙的科技體驗感。在數字員工領域,訊飛星火大模型+數字員工,優化了數字員工語音和文本交互體驗。
前不久,科大訊飛宣佈了與華爲的合作,表示訊飛星火將與華爲昇騰AI強強聯合,全力打造中國通用智能新底座,最後還特地補充了一句,“國產大模型只有基於中國自主創新的算力底座纔有大未來。”
說這句話,訊飛是對的。行業內都清楚,訊飛星火大模型發佈之前,沒有任何關於訊飛和大模型有關的新聞。短短几個月就能自研出大模型是不可能的。有消息稱,訊飛可能用的是開源大模型底層,加以改造優化形成了訊飛星火大模型。這也是很多大模型中小廠的普遍做法。
行業內已經有人提出過這樣的疑問,訓練大模型平均一次就要500萬美元以上的費用,以訊飛財報披露的營收和盈利數據來看,幾千萬元的淨利潤,用來訓練大模型有一定難度。那麼,接下來,如何保持迭代能力,可能是困擾訊飛星火的一個關鍵因素。
但是,訊飛星火在教育領域的優勢還是比較突出的,如果訊飛能安下心來踏踏實實主攻教育賽道,以科大訊飛的體量來說,是最合適也是最合理的。
訊飛的幾款硬件產品也都不錯,包括我一直在用的訊飛智能辦公本,採訪的時候打開,語音直接生成文字,幾乎沒有錯別字,識別率超過90%,很實用。
這與訊飛長期的技術積累密不可分,尤其是在語音能力和語義能力的理解上,有一定的行業地位。而對於自然語言處理、圖像能力等方面,也就是多模態能力,訊飛並沒有太多積累。
訊飛星火還有一個優勢,就是訊飛的政企資源較豐富,業務能力強。目前,訊飛正在江蘇、山東等地與政府部門談,希望拿到一些產業園、工業園的資源,比如跟政府籤一個打包的協議,然後在這些園裡的企業是不是都能用它,或者採購一筆。這是很多企業羨慕的資源。
受地域限制,科大訊飛偏安合肥,要想招到北上廣深杭的AI領域的頂尖人才,有一定難度,而且隨着大模型賽道的火熱,此類人才的成本也是水漲船高。訊飛可以利用好中科大資源,自己培養行業人才,一旦養成,偏安一隅便成了優勢,人才不易流失。
所以,綜合來看,訊飛星火充分發揚在教育領域的優勢,專心繼續深耕,或許是更好的選擇。
字節雲雀:不拉垮,也不驚豔
除了上述幾家比較頭部的大模型企業之外,還有一些進入比較晚的大廠以及專注於大模型的初創公司,我隨便選幾個有關注度的聊聊。
首先說字節,也就是抖音,這是互聯網行業不可小視的力量,下一個時代的巨頭。但是,爲什麼抖音在大模型領域沒有什麼動靜呢?此次突然出現在首批名單當中的抖音雲雀大模型,大家也是比較陌生。
其實是這樣,按照字節一貫的套路,低調,猛做但不張揚。以抖音的人才密度和深度,以及資金實力,未來在大模型行業裡,抖音雲雀都是一個極具競爭力的玩家。從內部投入來看,投入力度和態度,要比華爲、阿里和騰訊更決絕,更猛烈。
抖音雲雀大模型下面有個To C的產品叫豆包,試用了一下,感覺並沒有那麼拉胯,及格,當然也沒有多麼驚豔。作爲一個新產品,已經很可以了。
百川:新新公司的希望
百川智能,今年上半年才成立的大模型賽道的新新創業公司,創始人王小川,此前的搜狗創始人,學霸,頗有傳奇色彩,創業就自帶光環。
6月15日,百川智能推出70億參數量的中英文語言模型Baichuan-7B,一個月後又接連發布了參數量130億的通用大語言模型Baichuan-13B-Base、對話模型Baichuan-13B-Chat及INT4/INT8兩個量化版本。幾天前,百川智能又宣佈推出新一代大模型Baichuan-53B。
可以說,百川也是真的拼了,這迭代速度真的可以。但是,作爲創業公司,百川能夠在首批獲批名單當中,這對於王小川來說是一個天大的好消息。要知道,創業公司做大模型最缺的不是錢,而是數據。與BAT的龐大數據量相比,沒有大量數據來訓練大模型,是不可想象的。當然,創業公司也缺錢。大模型訓練一次,500萬美金起步,這對於創業公司,恐怕是難以支持的。
當然,最可喜的還是百川能進入首批獲批名單,能夠吃到第一波紅利,至少能暴漲不少用戶,既打了品牌,又積累的用戶數據,這是好事,也是相關部門的考慮因素,放一個初創公司進來,看看效果。
智譜、智腦及其他
智譜,是國內最早一批研發大模型的企業。成立於2019年,由清華系成果轉化而來,身上有一些清華光環。
當前,智譜已經發布包括雙語千億級超大規模預訓練模型GLM-130B,中英雙語對話模型ChatGLM、認知大模型平臺Bigmodel.ai,包括CodeGeeX和CogView等產品。
基於ChatGLM,智譜已於今年推出To C聊天對話應用“智譜清言”。而在To B層面,智譜也已經與多家國內互聯網巨頭,政企達成合作。
但是,畢竟不是大廠,無論財力還是人力,智譜大模型肯定是沒有優勢。但是,他們走了一條適合自己的路,就是對客戶的服務比較緊密,貼身服務,定製化服務。而且,與字節、360也有合作,與他們一起打單政企客戶,屬於寄居性的商業模式。問題是,這種定製化服務,客戶少還能服務得過來,如果客戶多了,服務質量就難以保證。這是智譜目前暴露的問題。
360智腦大模型,與智譜有點類似,主要針對政企客戶,深入服務,至於大模型本身的技術能力,不是很突出,也不是很重要。以周鴻禕的作風,品牌肯定先打出來,佔個位置。以360的財力,也是難以支撐大模型的迭代訓練的,當然,業內人士分析,360智腦大模型的底層應該來自於當初還開源的某個底層。
至於其他,很多大型中型企業、各大院校、三大運營商等等都有大模型推出,加上更多爲大模型而生的初創公司,寫是寫不完的。
最後還是那句話,大模型三要素:算力、算法和數據,缺一不可,而背後支持的就是資金和人才。
這是一場燒錢大戰。當然,燒錢才能把行業燒熱,才能誕生新技術、新革命,這也是大模型從業者對於下一個時代的光榮責任。
過幾年回頭再看,就理解了這個標題,決戰“大模型”,可能不只是九死,而是“百死一生”。