2024年十大國產大模型盤點:款款超能打,黑馬卻是這家?
今年8月,國家互聯網信息辦公室公佈的數據顯示,國內已通過國家級備案的人工智能服務達到了188款,地方網信部門登記在冊的生成式人工智能服務則達到了26款。一共超過200款AI大模型出現在互聯網上,頗有行業一片欣欣向榮的氣息。
不過如同新能源汽車行業的發展歷程,大多數技術或資金底蘊不足的AI企業,最終很可能成爲強者的墊腳石。頭部企業的產品規劃和發展方向,往往代表着行業動向,更是小企業的生機所在。24年,到底有哪些足以代表行業方向的大模型呢?雷科技旗下智能Pro在本文進行一波盤點。
文心一言:國產大模型排頭兵
ChatGPT初露崢嶸之時,不少網友曾表示,通用AI大模型跟搜索引擎沒區別。
的確,當初AI大模型給人的感覺很像搜索引擎,身爲國內用戶數量第一的搜索引擎公司,百度自然感受到了壓力。於是2023年3月16日,百度正式發佈了AI大模型文心一言,領跑國內AI行業。
經過數次迭代,文心大模型的功能愈發豐富,並陸續推出了文心大模型3.5/4.0/4.0 Turbo,以及文心大模型4.0工具版等多個版本。到如今,文心大模型已支持輸入文字、圖片、網頁、PDF等不同模態的信息,可輸出文字、圖片等多種模態的信息。
(圖源:文心一言官網截圖)
從文心大模型4.0工具版的命名就能看出,文心大模型正在從“泛用性”向“專用性”邁進,已不再是單純的“搜索引擎”,而是可以幫助用戶提高辦公效率的工具。取得行業頭部地位後,文心4.0大模型已收費服務,僅留下文心3.5供用戶免費使用。
智譜清言:清華血脈,B/C端同發力
絕大多數我們熟知的AI大模型偏向C端使用場景,擁有清華大學學術“血脈”的智譜清言則是B端與C端並進的一款AI大模型。目前智譜清言加入了AI搜索、AI畫圖、PPT生成、視頻生成、長文檔解讀、數據分析、視頻生成等功能,其首頁推薦的功能也以辦公場景爲主。
然而智譜清言的資源比不了騰訊、百度、阿里巴巴、字節跳動等企業,開發多款大模型的壓力不小。同時開拓B端和C端市場,更像是重壓之下的突圍措施。《中國大模型中標項目監測報告》顯示,今年前三季度智普華章中標大項目達到了22個,追上了訊飛星火和百度文心一言,但披露的中標金額僅爲2472.3萬元。
(圖源:智譜清言官網截圖)
小雷曾使用智譜清言創作文章、視頻、圖片,體驗都還算不錯,可沒有一樣能夠稱得上第一。沒有什麼缺點,又難以找到讓人眼前一亮的優點,是智譜清言當前面臨的問題。
小雷認爲,智譜清言應當集中資源和技術,放棄多線競爭,主攻面向專業場景的B端市場,強化品牌定位。等到B端市場取得一定成果後,再開拓衆口難調的C端市場。
豆包:全能、強大、真好用
就小雷的“身邊統計學”而言,豆包已經成爲了小雷和同事、朋友最常用的AI大模型。字節跳動財大氣粗,旗下AI的大模型就有即夢、海綿音樂、星繪等,分別面向視頻生成、音樂生成、圖片生成等多個領域。僅下載一個豆包,無法體驗到字節跳動在AI大模型領域的全部實力。
(圖源:豆包官網截圖)
不過豆包在文字、繪圖等方面的出色表現,足以令其穩居AI大模型第一梯隊。尤其是作圖方面,豆包加入了絕大多數通用大模型不支持的圖片區域重繪、擴圖功能,生成圖片的清晰度也超過了其他大AI大模型,雷科技目前的許多配圖均由豆包AI生成。此外,豆包的各項功能也在朝着專業化場景發展,可幫助用戶做PPT、寫代碼。
難能可貴的是,豆包暫時還沒有推出開通會員或充值選項,依然可以免費使用,而且提供豐富的智能體可用,甚至包括禮物挑選、飲食推薦、好評撰寫等。
訊飛星火:B端強勢,C端起勢
科大訊飛是國內B端市場舉足輕重的企業,其推出的訊飛星火大模型也以B端場景爲主,廣泛應用在醫療、教育、工業、科研等諸多領域。10月24日科大訊飛發佈的訊飛星火4.0 Turbo,更是號稱七大核心能力全面超越GPT-4 Turbo。
面向C端市場,訊飛星火大模型也支持AI搜索、PPT生成、圖像生成、內容寫作等功能,其提供的智能體更是五花八門,從吃喝玩樂到日常工作再到結婚策劃一應俱全。
(圖源:訊飛星火官網截圖)
總體來說,訊飛星火大模型提供的功能主要依然圍繞文字信息,圖片生成功能中規中矩,編程倒是亮點,文字工作者可以使用訊飛星火生成詩詞、宣傳語、小說、視頻腳本等信息。B端市場訊飛星火已佔據主導地位,或許未來會發力C端,推出更多實用、好用的功能。
有道子曰:專注翻譯,贏在專業化
與前面幾款加入了專業辦公能力的通用大模型不同,有道推出的子曰大模型專注於翻譯場景。據有道首席科學家段亦濤介紹,子曰大模型2.0升級了口語對話、教育場景下的知識問答、文字處理三大能力,並且拓展到了更多學科、學段。
專業場景一直是翻譯界的難題,因此纔會出現商務英語、計算機英語等學科,子曰大模型以翻譯功能爲核心,可更智能、精準地翻譯內容。此外,有道官網顯示,在AI大模型的加持下,有道還加入了AI寫作、AI PPT、AI口語陪練等功能。
(圖源:有道官網截圖)
本站有道和百度翻譯是小雷最常用的兩款翻譯軟件,但在體驗中,偶爾會遇到專業名詞翻譯不精準的問題。AI大模型可根據口語習慣進行訓練,面對一些有歧義、不常用的詞語,將能夠提高翻譯的準確性。
Kimi:文字生成領域的真王者
月之暗面不算大公司,擁有的資源比不了百度、阿里巴巴、騰訊、字節跳動,但其開發的Kimi卻創造了奇蹟。點點數據公佈的11月蘋果平臺全球AI APP下載量數據顯示,Kimi以6%的份額位列第四,另一個進入前五的國產AI應用則是豆包。國內市場,新榜公佈的AI產品周榜中,Kimi以760萬周訪問量位列第一。
嚴格來說,Kimi的功能不算豐富,主要圍繞文字內容和思維導圖,甚至沒有其他AI大模型標配的文生圖功能。但Kimi免費使用的策略、強大的文件解析能力、多語言對話能力等,令其成爲了許多文字工作者的首選AI大模型。
(圖源:Kimi官網截圖)
小雷經常使用Kimi搜索信息、解讀文件、檢查文章錯別字,Kimi的爆文生成器功能更讓小雷有了把過去構思的小說內容,通過AI大模型寫出來的衝動。
Kimi的爆火證明,AI大模型功能的豐富度並不與用戶數量呈正相關,把爲數不多的功能打磨好或許更加重要。近期,月之暗面又推出了視覺思考模型k1,強化了Kimi的數理化基礎科學思考能力,而且能夠呈現完整的思維步驟,未來或將成爲學生們的學習利器。
快手可靈:讓視頻大模型不再是期貨
Sora發佈後,無數網友嘲諷中國互聯網科技公司沒有創新力,創造不出能夠媲美Sora的產品。然而僅僅四個月後,在Sora仍處於PPT狀態的情況下,國內短視頻平臺快手旗下的AI團隊就打造出了視頻生成大模型可靈。
經過小雷的實際體驗,在國內視頻生成大模型中,可靈穩居第一梯隊,並且是第一名的有力競爭者。在文生視頻之外,可靈還加入了圖生視頻功能,並且可以篩選不希望呈現的內容。
(圖源:可靈官網截圖)
除了生成視頻,可靈還支持文生圖和AI試衣功能,其中AI試衣即用戶上傳衣服和模特,生成模特穿着該衣服的圖片。若是需要在網上買衣服,可以考慮使用可靈測試衣服是否合身。接下來,可靈還將上線視頻剪輯功能,幫助用戶創作視頻。
視頻生成大模型是否成熟,關乎AI大模型能否理解真實世界,重要性可能比其他通用大模型更高。可靈、即夢、Vidu等視頻大模型的出現,讓我們看到了AI理解世界和幫助我們揮灑創意的可能。
華爲盤古:爲B端專業場景而生
訊飛星火、智譜清言等大模型,雖以B端爲主要業務方向,但也提供大量功能供C端用戶使用,華爲開發的盤古大模型則完全面向B端,應用範圍正如其名,涵蓋交通、工業、建築、媒體、氣象、醫藥等多個領域,堪稱包羅萬象。
盤古大模型支持十億級到萬億級參數的不同規模大模型,能夠幫助企業推理各類複雜的任務。儘管盤古大模型並非面向C端的產品,但其帶來的效率提升,能夠影響到我們生活的方方面面。
(圖源:華爲官網截圖)
通用大模型容易被數據污染,加上其黑盒訓練模式,日常使用時部分查詢到的數據可能還需要校對。專用大模型,尤其是面向工業領域的產品,可避免數據污染。盤古大模型的名氣或許不如很多大語言模型,但價值毋庸置疑。
通義千問:低調的掃地僧
作爲與字節跳動、百度、騰訊並列的互聯網巨頭,阿里巴巴推出的AI大模型通義千問似乎有些低調,唯有專用於寫代碼的通義靈碼,小雷曾看到過營銷廣告,並推薦給程序員朋友使用。
儘管名聲不顯,但通義千問卻十分好用,其支持的功能與其他產品相差不多,提供生活、工作、繪圖、職場相關諸多智能體可用,而且還支持擴圖功能。需要注意的是,通義靈碼可以付費解鎖高級功能,通義千問則免費服務。
(圖源:通義官網截圖)
現階段通義千問名聲不顯,畢竟其存在價值更多是服務於阿里雲智能業務——AI算力需求的爆發式增長,是阿里必須抓住的機會,正因爲此阿里也投資了大半個中國AI大模型創業生態。
騰訊元寶:產品剛起步,彰顯巨頭意志
與前面幾款大模型相比,騰訊元寶的功能特性其實沒太大區別,但其提供的智能體卻相對較少,整個界面看上去也略顯簡陋。值得一提的是,騰訊元寶提供的智能體,主要以影視作品中人物爲原型,包括李承乾、範閒、海棠朵朵等,支持聊天對話功能,繼承了騰訊擅長的社交基因。
(圖源:騰訊元寶截圖)
另外,騰訊元寶還加入了最新的混元文生視頻大模型,可以根據用戶描述生成視頻。小雷之前體驗了該大模型,目前與可靈、即夢、Vidu等產品差距明顯。
對於騰訊而言,大模型暫時落後不是大問題。擁有雄厚財力的騰訊,完全可以發揮自己的場景優勢,或者收購其他AI公司以壯大實力。參考新能源汽車行業的發展歷程,未來數年內國內必然會有大量AI公司倒閉,其中不乏擁有一定實力的企業和技術人員,騰訊通過收購,就能快速提升麾下AI團隊的實力。
總結:大模型由虛向實,全面收費成必然
國內AI行業起步期,我們所能接觸到的相關應用,主要爲聊天解悶,部分產品還打出了“電子伴侶”口號。這是因爲當時國內AI企業技術實力不足,且對於行業的發展方向沒有明確認知。經過長時間的探索,AI企業逐漸找到了正確方向。
從這些頭部企業的動作來看,AI大模型的主要發展方向就是由虛向實,既不是“聊天機器人”,也不是“搜索引擎替代品”,而是能夠分析和解讀文檔、圖片、視頻、音頻等模態文件,並輸出我們所需模態信息的智能體。
頭部企業還在打造專業化使用場景,如幫助用戶生成PPT、製作視頻和音頻、編寫代碼等等。若無專業智能體,僅依靠原有的問答、搜索等功能,難以將因好奇和興趣體驗AI大模型的用戶轉化成付費用戶。
(圖源:豆包AI)
儘管現階段可免費使用的AI大模型不少,但付費恐怕已被頭部企業提上了日程,上述十款AI大模型中,文心一言、智譜清言、有道子曰、可靈等,均已提供付費服務,其中文心大模型提供網頁端付費版和全端付費版可選。其他AI大模型暫時處於內測或公測狀態,正式版很可能也會要求用戶付費。
小雷沒有列出的AI大模型中,面向專業場景的產品如即夢、百應、WPS AI等,都需要付費使用。AI大模型的訓練和推理需要耗費大量成本,無法永遠免費爲用戶提供服務,付費使用遲早會到來,無非是早一天晚一天罷了。
總的來說,一年多時間的探索下,國內AI企業基本明確了發展方向,將持續佈局專業使用場景。我們接觸較多的大語言模型,也將融入更多功能,最終被打造成萬能大模型。AI大模型越來越好用的同時,能夠免費提供給我們使用的功能只會越來越少,付費使用的時代即將到來。
最令小雷失望的是,這些AI大模型仍然在雲端完成推理任務。與許多網友在意的隱私問題不同,小雷期待本地大模型,所注重的是減少雲端算力需求,將推理成本轉移到本地,並降低AI大模型的價格。然而考慮到監管、破解版等問題,未來很長一段時間內,恐怕AI企業都不會願意推出PC端本地大語言模型。