迎着應用爆發的曙光,百度將推出新版文心大模型
11月21日晚,百度發佈截至2024年9月30日的第三季度業績。財報顯示,百度總營收336億元,百度核心營收265億元,歸屬百度核心的淨利潤75.4億元,同比增長17%,超出市場預期。
最值得關注的是,李彥宏在業績會上透露,百度將於2025年初發布文心大模型的新版本。目前,文心大模型日均調用量已達15億次,一年內增長30倍。新一代文心大模型的推出,無疑將進一步鞏固百度的領先優勢。
同時在業績會上披露的,還有百度文庫和百度App的最新數據——當前,百度文庫AI功能月活用戶已經突破5000萬,同比增長超300%;百度App AI功能已覆蓋近70%月活用戶。
在這些數字的背後,百度正在形成以AI爲長期戰略、以應用驅動爲主要路徑的核心打法。
日均調用量15億意味着什麼?
相較一年前首次披露的5000萬次,百度最新財報顯示,百度文心大模型最新的日均調用量已經超過15億,增長30倍。
作爲基座的大模型,文心大模型調用量陡增的背後,意味着大模型應用在百度內外開始初現爆發趨勢。
李彥宏不久前說,在6個月前它的日調用量數據還是2億時,自己曾和百度高管討論大模型的未來時說:“如果我們的大模型日均的API調用量一年之內漲10倍,我認爲就成了。現在僅僅半年過去,我們就比較接近這個數字了。”
大模型也正成爲驅動智能雲服務增長的重要力量。百度高管披露,本季度百度智能雲營收達49億元,同比增長11 %,Non-GAAP 經營利潤率同比提升。其中,AI相關收入佔比持續提升至超11%。可以說,智能雲業務已經構建起百度的第二條增長曲線。
面向產業實際需求,基於高效的模型生產機制,百度建設了文心大模型矩陣。在第三季度,百度推出兩款新模型,從旗艦款4.0、速度更快的Tubro,到增強的輕量級模型Speed Pro、Lite Pro等。明年年初,百度還將推出新版文心大模型,進一步完善文心繫列模型。
百度既要持續投入研發領先的基礎大模型,也要解決模型應用落地時遇到的技術卡點,在百度世界上剛剛發佈的iRAG技術,極大解決了文生圖的幻覺問題,提升圖片生產力。
檢索增強(RAG)已經是大模型行業的共識,過去24個月,李彥宏認爲,對行業而言最大的變化是大模型基本消除了幻覺,回答問題的準確性大大地提升了,讓AI從“一本正經的胡說八道”,變得可用、可被信賴。
此前,完全基於大語言模型的文生圖系統,生成的圖片往往“一眼假”,甚至邏輯不合常理。李彥宏曾在百度世界大會展示了一張用開源大模型生成的北京天壇的圖片,看上去確實有點像天壇,但錯把天壇的三層生成了四層。類似地,針對長城、東方明珠、金字塔、愛因斯坦、貝多芬等特定地點、物品和人物,張冠李戴的幻覺現象普遍存在,這也是爲什麼今天的多模態大模型還沒有什麼成規模應用跑出來的原因。
今年年初時,在整個中文互聯網都爲Sora而捶胸頓足的時候,百度決定解決圖像生成的幻覺問題。百度最新發布的檢索增強的文生圖技術iRAG,就是將百度搜索的圖片資源跟基礎模型能力相結合,可以生成各種超真實的圖片。
李彥宏以“畫一張大衆攬巡汽車飛越長城的圖片,寫實風格”爲提示詞,生成的圖片放大來看,無論是這款特定型號汽車的車型車標、還是作爲背景的長城,均未出現錯誤或變形的幻覺問題,二者的融合度較高。
iRAG的商業價值體現在:無幻覺、超真實、沒成本,立等可取。這意味着隨着AI生成圖片技術進步和可用性的提高,應用空間也正在打開。例如,在品牌宣傳場景,過去拍一組海報動輒需要一二十萬,甚至大幾十萬,但是現在這種創作的成本接近於0。
AI之所以被業界視作“產業革命級”的機會,正是因爲它對社會經濟帶來了生產力的無限擴張的可能。
在基礎大模型能力就緒的前提下,業界即將迎來AI應用爆發。 “每一個應用都是一顆星,每一個應用都將成爲改變世界的力量。”李彥宏說。
本月,百度還發布了基於大模型的100大產業應用,涵蓋了製造、能源、交通、政務、金融、汽車、教育、互聯網等衆多行業。李彥宏說,這其實也代表百度的認知和態度。百度不是要推出一個“超級應用”,而是要不斷地幫助更多人、更多企業打造出數百萬“超級有用”的應用。
文庫成AI應用“黑馬”背後
過去一年,百模大戰如火如荼,國內外不少大模型團隊熱衷於跑分與對標。李彥宏則在多個公開場合向行業呼籲應用的重要性,稱“要卷AI原生應用,不要卷大模型”。
在不久前的一次訪談中,李彥宏在迴應什麼是百度戰略取捨的第一性原理時再次指出,“是應用驅動。”
“這個和美國很多公司做法很不一樣,美國很多公司一直都是夢想說我要做顛覆性的技術,我要多少年之內做成什麼什麼樣子,如果能產生應用,好像是個 side product。我更多希望儘早接觸場景及接觸應用,看在這個過程當中,到底遇到了什麼問題,把這些問題帶回來,我們綜合看一下,大家遇到的最多的問題,就是我們優先解決的問題。”李彥宏此前在公開場合表示。
過去一年裡,百度開始對全線業務進行AI原生重構。百度的“老”應用百度文庫發出新芽,成爲內部AI重構率先跑出的“黑馬”。
大模型重塑之下,百度文庫從“內容檢索平臺”變身“一站式AI內容獲取和創作平臺”,推出了智能PPT、智能寫作、思維導圖、研究報告、拍圖生文、智能畫本、智能漫畫、AI搜索等上百項文本類、跨模態類和多模態類AI能力,共同構成了內容創作的“AI百寶箱”。
李彥宏披露,今年9月,百度文庫AI功能月活用戶突破5000萬,同比增長超300%。此外,用戶的付費意願不斷增強,第三季度文庫的訂閱收入同比增長23%。
以百度文庫 PPT功能爲例,根據月狐研究院數據,百度文庫智能PPT市場份額已達八成。李彥宏也曾提到,百度文庫是“AI重構最徹底”的產品之一。
而在AI的“加持”下,百度網盤再也不只是存儲工具,而是升級爲“一站式內容存儲、管理和消費平臺”。不久前,百度文庫和百度網盤深度融合,在百度世界大會上發佈“自由畫布”功能。
簡單來說,自由畫布讓用戶可以在一塊AI“畫布”的界面上,自由拖入文庫和網盤內的文檔、音視頻等富媒體素材,迅速生成多模態內容。
“自由畫布”的背後得到了文心多模態大模型的強力支持,它不僅是一個簡單的編輯工具,更成爲了一個能夠智能輔助用戶完成從資料查找、內容編輯到生成和分享全過程的萬能白板。這一內容創作的創新設計,極大地提升了內容創作的靈活性和效率,使得用戶能夠更直觀地組織和展現自己的想法。
以行業分析師撰寫研究報告爲例,通過自由畫布,未來研究報告可能會是包括傳統的圖文、表格、發佈會視頻、電話會錄音等更加多模態的呈現方式。
李彥宏強調:“自由畫布不是期貨,而是立即可用的現貨。它代表着一種真正服務於創造的新質生產力,將爲用戶帶來前所未有的內容創作體驗。”
據記者瞭解,自由畫布亮相首日,20萬人排隊預約,上線後,預計文庫的月活躍用戶還將進一步增長。
AI+搜索擦出什麼火花?
搜索依然是百度業務的基本盤。上季度,百度高管曾披露已有18%的搜索結果由AI生成,到了這一季度,李彥宏稱在百度搜索上,已有超過20%的搜索結果頁面涵蓋AI生成內容。
同時,他還透露了一組新數據:百度App AI功能已覆蓋其月活用戶的近70%,與AI互動的用戶使用時長更高,每日總互動次數可達數千萬。一位內部人士對記者表示,覆蓋率是一個更加面向未來的數據,作爲對比,同行目前的覆蓋率不足50%。
站在當下看未來,構建智能體+搜索的全新生態,正在爲百度打開基本盤的想象空間。
不同於傳統互聯網搜索,基於文心大模型,百度搜索能夠不僅能夠實現定製內容生成,還能夠生成文字、圖片、動態圖表等多模態答案,以最大限度滿足用戶更復雜的需求。
而在不斷提高AI生成內容質量的同時,百度搜索也在進一步豐富內容格式的多樣性,如AI摘要、圖片、視頻、智能體、思維導圖等等。這些不同的格式可以動態組合,賦予用戶個性化的搜索體驗。
事實上,作爲百度的基本盤,搜索的重要性從未降低,而百度在應用方面的種種動作表明,正在構建一個以搜索爲入口的全新生態。
值得一提的是,搜索AI功能高覆蓋率背後,遠遠不止於“AI生成”。更大比例和廣闊的機會是“智能體”,就像李彥宏在百度世界上展示的,當用戶在百度搜索公司官網、詢問行業建議,搜索結果都可能喚起智能體。
此前,百度多次強調智能體是AI應用的最佳形態,將形成數百萬智能體生態,而百度搜索則是智能體的最佳入口。
在技術上,百度正在努力降低門檻。在百度世界2024上,百度發佈無代碼工具秒噠,具備無代碼編程、多智能體協作和多工具調用三大特性。作爲一個不需要寫代碼就能夠實現任意想法的工具,秒噠讓每個人都具備程序員的能力,會說話就能做出應用。李彥宏總結說,“只要有想法,你就可以心想事成,我們將迎來一個前所未有的只靠想法就能賺錢的時代。”
不少企業已經展開智能體應用。與傳統官網的靜態展示不同,企業智能體能夠對最新信息或者最個性化問題的回答。數據顯示,比亞迪的官方智能體上線後,銷售線索轉化率提升了119%。”
“未來,公司官方智能體很可能將替代官網,成爲最直接面向消費者的界面。”李彥宏預計。
李彥宏還展示了角色、工具和行業等多類智能體的特色功能及使用場景。以數字人爲例,在百度搜索“教育輔導”關鍵字後,記者看到,搜索結果頁中出現不少數字人的視頻內容。這些數字人,動作、語言、口型非常自然,並且能夠在合適的時機停下,回覆網友現場提出的問題。
“如果不說的話,你都不知道是數字人。” 李彥宏稱,今天的數字人直播,很多情況下,轉化率已經超過了真人。
記者瞭解到,百度公司類智能體在百度世界2024亮相後,首日即有582家企業達成合作。
作爲AI時代的第一入口,一旦智能體生態成型,百度搜索將重新成爲“第一入口”。這無疑是百度重要的“長期戰略”。而第三季度的多項數據表明,這一戰略,已經邁出了成功的第一步。