OpenAI看好的方向,文心智能體技術搶先爆發!
新智元報道
編輯:編輯部 HYZ
【新智元導讀】2024年世界互聯網大會領先科技獎揭曉,文心智能體技術獲獎!至此,百度大模型技術已連續兩年獲得該獎。
11月19日,2024年世界互聯網大會領先科技獎揭曉了。
在來自24個國家和地區的270項科技成果中,共有20項成果入選領先科技獎。
作爲AI領域的關鍵代表,獲此殊榮的百度文心智能體技術尤爲令人矚目。
最近,Scaling Law撞牆論成爲熱門話題,大模型是新的科技泡沫嗎?
橫跨互聯網幾個時代的巨頭百度告訴我們:所謂「AI應用難落地」,「商業化沒途徑」,還是因爲看得不夠遠。
正如國家卓越工程師、百度首席技術官王海峰所言,智能體,就是最能激發大模型潛力的應用方向。
隨着智能體技術的突破,更多的創新將得到激發。而智能體給社會經濟發展帶來的巨大價值,也將近在眼前了。
AI智能體,像人一樣「慢思考」
百度的智能體,背後究竟是怎樣的技術原理?這就要從人類的認知系統講起了。
在心理學研究中,將人類的認知系統分爲兩種:系統1和系統2。
系統1代反應快,但容易出錯;而系統2思考慢一些,但更準確、理性。
基於這一認知特點,百度開發出了突破性的慢思考機制——系統2,其核心就是「思考模型」。
「思考模型」包含了四個關鍵要素:理解、規劃、反思和進化。
在這四個環節緊密配合之下,AI系統便能夠可靠地執行任務、持續自我進化,並在一定程度上將思考過程白盒化。
爲了實現真正的智能思考,百度在基礎大模型之上開展了三個層面突破性的增強訓練。
首先是,思考過程的有監督精調,讓模型像人類一樣進行任務拆解、自主規劃。
假設你要計劃一次蘇州園林之旅,「思考模型」不僅能理解你的需求,還會像人類導遊一樣,考慮到景點分佈、開放時間等因素,爲你規劃出最優路線。
其次是,行爲決策的偏好學習,讓模型學會運用工具和決策。
比如統計《師說》中,「師」字出現的頻率,模型會主動調用搜索工具獲取全文,再調用代碼解釋器,對其出現的次數進行精確的計算。
最後是結果反思的增強學習,讓模型學會檢查工具的結果,並動態調整行爲。
這一過程就像人類對信息真實性會產生質疑一樣,AI也學會了審視數據的準確性。
舉個栗子,在統計國慶檔電影票房排行數據時,出現了兩個不同來源的差異數據:一個是2.15億元,另一個是2.35億元。
這時,模型會主動分析可能的原因(數據更新的不同時間、不同統計來源等等),然後進一步檢索尋求驗證,最終確保信息的可靠性。
那麼,訓練「思考模型」的數據從何而來?畢竟人類思考過程,往往只會發生在每個人腦海中,很難外顯數字化,因此急難獲取相應的數據。
對此,百度創造性構建了「數據合成」的虛擬環境。
在提示構建階段,基於領域知識自動合成業務邏輯,通過工具模擬器靈活模擬業務所需的工具,通過用戶模擬器生成用戶可能的問題或指令,並與智能體交互。
然後,根據輸入的提示,思考模型自動探索思考和行動的不同路徑,並通過分步執行來模擬智能體的行動過程,最終生成高質量的合成數據。
更進一步地,基於這些合成數據,再利用RL對「思考模型」進行優化。
最終,讓機器實現像人一樣的思考和行動,自主完成複雜任務,同時在環境中持續學習、自主進化。
智能體的工作流
斯坦福計算機系客座教授曾指出,AI智能體工作流將會在今年取得巨大的進步,甚至還會超越下一代基礎模型。
我們都有過這樣的經歷,詢問ChatGPT/Claude等模型後,卻得不到滿意的輸出。
但智能體的關鍵作用之一,便是提供反饋幫LLM去改進輸出,最後獲得更好的響應。
其實,一個基礎的智能體架構,應該包含了記憶、規劃、工具、行動四大方面。
前OpenAI研究員Lilian Weng——LLM Powered Autonomous Agents
而且,在具體工作流中,智能體又有四種不同的設計模式。
首先是反思(reflection),大模型能夠自己檢查工作,並提出改進方法。
其次是工具使用(tool use),能夠主動利用網絡搜索、函數調用等任何功能,完成信息收集數據處理,或採取行動。
緊接着是規劃(planning),提出一個多步計劃並實現目標。
最後是多智能體協作(multi-agent collaboration),多個AI智能體一同協作,分配任務並討論想法。
總結來說,AI智能體的出現並非讓LLM直接生成最終輸出,而且多次提示大模型,最終構建出更高質量的輸出。
始於模型,但不止於模型
百度智能體背靠着的文心大模型技術,讓它在落地應用上有了堅實的基礎。
自去年3月16日發佈文心一言以來,百度文心大模型不斷升級,知識增強、檢索增強以及智能體等技術也在不斷進化。
今年9月以來,百度文心大模型的日均API調用量,已經暴增至15億水平,短短半年增長7.5倍。
究其原因在於,它極大地改善了幻覺問題。
憑藉搜索引擎的技術積累,百度引入了檢索增強機制。通過搜索互聯網上已有的知識,讓大模型給出更準確的回答。
百度研發的「理解-檢索-生成」協同優化的檢索增強技術,極大提升了大模型技術及應用效果。
在文本生成領域,檢索增強的應用已經成熟。下一步,就解決文生圖的幻覺問題了。
爲此,百度的研究團隊將百度搜索的億級圖片資源,跟強大的基礎模型能力結合了起來,開發出了基於檢索增強的文生圖技術iRAG,讓圖片生成的效果更加真實。
現在,iRAG既可以生成精確的圖片,也可以進行泛化生圖。
具體來說,大模型會首先對用戶需求進行分析理解,自動規劃精確或泛化方案,比如對哪些實體進行增強;接着在增強階段,對需要增強的實體,檢索並選擇相應的參考圖。
最後在生成階段,自研的多模可控生圖大模型,就通過局部注意力實現圖像的高泛化生成,另外還能通過整體注意力計算,進行高精確的圖像生成。
正如李彥宏所說——
從此,AI大模型可以快速走向智能體,迎接原生應用大爆發了。
智能體,開啓AI應用新紀元
如今,憑藉着門檻低、天花板高,既能讓人人都上手,又能做出複雜強大應用的特點,智能體正在成爲AI應用最主流的形態。
就連OpenAI的CEO Sam Altman也表示,「下一個關鍵突破,就是AI智能體」。
放眼全世界,各大科技巨頭、獨角獸在AI領域裡掀起了一波智能體技術競賽的高潮。
然而,鮮爲人知的是,在這波智能體熱潮之前,百度就已經完成了關鍵的佈局。
百度,已然領先
互聯網時代,百度搜索爲核心的應用,實現了人類發展史上第一次知識普惠。
進入下一個週期——大模型時代,AI將讓無數普通人都有望成爲超級個體。這個賦能者,無疑就是智能體。
李彥宏表示,現在大模型戰中所謂的「領先12個月」,「落後18個月」,其實都沒那麼重要。在這個完全競爭的市場環境中,無論選擇什麼方向,都會有很多競爭對手。
大模型熱到了第三年,我們已經經歷了大模型應用發展必經的幾個階段。
過去一年許多目光都聚焦在多模態,但其實,智能體纔是目前最能激發大模型潛力的應用方向。
原因就在於,它的門檻確實很低。
大模型變成應用有很多不確定性,但智能體卻是非常直接、高效、簡單的方式。基礎模型需要靠應用才能顯現出價值,而智能體是一個幾乎「放之四海而皆準」的大模型應用。
因爲門檻足夠低,甚至都不需要編程,只要用「人話」把工作流說清楚即可,比互聯網時代製作一個網頁還簡單。
如今,百度已經構建了一個強大的智能體生態系統。
百度的智能體技術充分釋放了文心大模型的潛力,成爲引領行業變革的新引擎。
IDC、沙利文、中國軟件評測中心等多家權威評測顯示,文心大模型超過國際領先大模型平均表現,位居中國第一、國際第一梯隊。
來源:IDC《中國大模型市場主流產品評估,2024》
如今,在營銷、客戶服務、企業辦公、代碼編程等領域中,智能體正重塑各行各業升級的新範式。
另一方面,百度基於智能體技術構建的「文心智能體平臺」,進一步降低了開發門檻,讓AI賦能變得觸手可及。
開發者們可以基於自身行業特點和應用場景需求,利用平臺提供的多樣化能力、工具,打造出大模型時代的AI原生應用。
基於易開發、能分發、有錢賺三大特點,讓這個平臺實現了價值閉環。
百度搜索AI問答
比如,38歲失業女性答主自創建了「情感諮詢導師曉曉」智能體,不僅有了意外的收入,還獲得了新的職業機會。
目前,文心智能體平臺已吸引超過80萬開發者、15萬家企業。
不寫代碼,就能實現任意想法了
目前,百度的智能體技術正在加速LLM深度融入社會各行業的各個環節,助力企業與社會服務智能化升級。
在政務領域,AI法律諮詢助手能爲勞動者提供及時準確的法律指導。
在農業領域,「農民院士智能體」讓科技助農變得更加便捷高效。
在教育領域,它能爲師生帶來更智能化、個性化的教學新體驗。
在輔助編程開發中,智能體降低了普通人開發應用門檻,也提升了專業程序員的編碼效率。
這裡,尤爲值得一提的是百度在「多智能體協作」領域的最新成果——無代碼開發工具「秒噠」。
用李彥宏的話說,它是「迄今爲止人類歷史最複雜的多智能體協作工具」。
多智能體協作,是基於文心大模型的思考和規劃能力,實現了對不同智能體的調度和編排。
在策劃、內容、開發等工作中,有小組長、策劃、小編、程序員和質檢員五個智能體相互協作,甚至還能自動識別bug,調用各種工具。
在演講現場,李彥宏曾以蘿蔔快跑新技術發佈會爲例,直接搭建了一個活動報名系統。
用中文描述需求,補充帶有大會時間地點主題的文檔,就可以指揮秒噠中的多個智能體協作了。
其中,小組長智能體會進行規劃調度,會將任務拆解並召喚各智能體來完成任務。
策劃智能體負責將策劃設計解決方案拆分成i核心需求、內容結構、開發需求、數據收集四個子任務。
小編智能體會編輯邀請函中的所有文字和媒體內容,包括髮布展望、時間地點信息、封面圖等。
程序員智能體通過寫代碼,製作和部署網頁。
這個過程中,通過場景知識的增強,提升了複雜代碼生成的質量與穩定性,能高效實現用戶所需的功能。
最後,質檢員智能體會檢查代碼bug,修復,進行代碼測試。
一套流程下來,活動邀請函立馬就生成了。
同時,百度的另一個多智能體應用——代碼助手「文心快碼」則升級到了3.0版本,全面進入智能體時代。
具體來說就是,在開發全流程中,會有多個智能體進行流水線協同,進而大幅提升程序員的工作質量和效率。
在推動傳統產業轉型升級的同時,百度智能體技術還催生了在智能家居、智能電商等新興產業發展。
更重要的是,它還創造出智能體工程師、訓練師等全新職業,推動人才培養模式創新,爲產業結構升級提供源源不斷人才支持。
站在新的歷史節點上,百度文心智能體正重新定義AI的發展方向。
在全球科技巨頭還在爲智能體技術摩拳擦掌之時,他們已用紮實的技術積累,以及豐富的實踐經驗,驗證了智能體技術的巨大潛力。
多次獲獎,是全行業的肯定
仔細回看,其實不止在今年,此前百度就曾五次在世界互聯網大會烏鎮峰會上獲此殊榮,得獎理由分別是百度大腦、小度助手、Apollo、飛槳、知識增強大語言模型技術。
今年的百度文心智能體,已經是第六次獲獎。
不僅如此,百度大模型相關技術還曾獲國家技術發明二等獎、中國專利金獎、吳文俊人工智能科技進步特等獎、中國電子學會科技進步一等獎等多個獎項。
從第一屆世界互聯網大會到現在的整整11年間,百度率先預判出下一步技術的突破方向,同時也不忘將技術與實踐緊密結合,迅速抓住當下市場的痛點。
百度大腦、小度助手(DuerOS)、Apollo自動駕駛平臺、飛槳開源深度學習平臺等,都是百度在行業內先行一步的探索,全部取得了成功。
這些領域內的前沿技術,帶動的不僅是百度的發展,也以引領者的姿態,推動了全行業的技術進步,讓全行業的技術發展坐上了快車。
更關鍵的是,百度並非只侷限於發展單一的技術,而是將格局放得更大,致力於建立一個包含硬件、軟件、服務和平臺的完整生態系統。
AI的未來究竟在何方?這個答案,或許就藏在百度智能體技術的一個個突破裡。
從去年10月的前瞻佈局,到如今智能體的蓬勃生長;從系統2思考模型創新,到智能體賦能萬千企業的實踐。
百度正用不斷創新的技術力量,爲每個領域帶去智能化的蝶變。