AI顛覆人機交互 大廠押寶Agent

21世紀經濟報道記者孔海麗 北京報道

AI Agent成了大廠必爭之地。

近期,蘋果、谷歌、Antropic、OpenAI紛紛發佈AI Agent進展 ,希望用大模型技術改變人機交互方式,找到AI最恰當的落地方式。

這其中,國內AI企業智譜快速佈局,領先海外巨頭一個身位。

繼10月25日首次上線可以代替人類操作手機和電腦的AI工具之後,11月29日,智譜發佈了AI Agent系列更新。

主打AI接管手機的AutoGLM,已經可以實現跨APP、跨設備、長流程的複雜步驟。

所謂AutoGLM,是指接收人類簡單語音指令,自動執行手機端複雜任務,任務執行過程中可以持續與用戶進行交互反饋。

根據簡單語音指令,AutoGLM可以在微信、小紅書、美團、淘寶、抖音、攜程等APP上執行發佈消息、查找店鋪、選購商品、路線導航、訂機票、訂車票、訂酒店等操作。

銀河證券近日發佈研報指出,AI Agent的崛起正重塑AI產業鏈並帶來投資新機遇,未來,AI Agent模型將改變C端流量入口的分配,或許還會取代APP的地位,並與硬件爭奪流量入口。

智譜CEO張鵬演示了“AI發給人類的第一個紅包”,他發出“面對面建羣併發布200個紅包”的語音指令之後,AutoGLM自動執行了打開微信、建羣、發羣紅包的系列步驟。

當然,輸入密碼還是需要人類確認的。

據介紹,AutoGLM可以實現觸控執行、內容理解、內容生成等大類別任務。

目前,AutoGLM覆蓋了手機端主流生活場景APP,包括微信、小紅書、抖音、微博、美團、大衆點評、餓了麼、淘寶、京東、拼多多、高德地圖、百度地圖、12306、攜程、去哪兒等。

另外,針對特殊場景,也可以實現跨APP操作。

比如,“在小紅書上搜索北京比較正宗的餐廳,找一家合適的在大衆點評上定位,並在微信上發送給老婆,告訴我它在美團上有哪些推薦菜,幫我高德導航過去”;“對比攜程和去哪兒下週三從昆明到烏魯木齊的航班價格”。

GLM-PC是面向PC端的自主Agent,目前開放第一階段的內測場景,包括會議替身、文檔處理、網頁搜索與總結、遠程和定時操作、隱形屏幕等。

不過,智譜方面坦陳,由於PC和PC任務的複雜程度,目前大模型的能力距離真正代替用戶辦公還有一定距離。GLM-PC在當前版本下,用戶仍需要輸入非常精準的指令。

大模型正在改變人機交互方式,而AI Agent是行業內公認的、最具潛力的AI落地方式。

或許,AI Agent可以將移動互聯網時代的“人適應機器”,推進到AI時代的“讓機器適應人”。

蘋果(Apple Intelligence)、Anthropic(Computer Use)、谷歌(Jarvis)和 OpenAI(Operator)等企業也已經把Agent作爲2025年的業務重點。

AI Agent能夠讓大模型完全執行人類的工作流程,適應、學習、迭代,與其他系統和人類協作,並端到端地完成任務。

在智譜CEO張鵬看來,現階段,AutoGLM相當於在人與應用之間添加一個執行的調度層,大幅改變了人機交互形式。

張鵬認爲,大模型發展會經過五個階段,分別是L1語言能力、L2邏輯能力(多模態能力)、L3使用工具的能力、 L4自我學習能力、 L5探究科學規律。

目前,Agent會極大地提升大模型的L3能力,同時開啓對L4自我學習能力的探索。

“而且,Agent可以看作是大模型通用操作系統LLM-OS的雛形,未來有可能實現原生的人機交互。”張鵬說。

從產業端來看,AI Agent有廣闊的市場機遇。銀河證券預計,到2028年,中國AI Agent的市場規模將激增至8520億元,年複合增長率達72.7%。

“AI Agent也會推動APP生態逐漸向端側生態轉變,成爲AI應用發展新趨勢。”銀河證券在研報中指出,AI Agent通過實現自然語言與硬件的交互,解決端側AI痛點,可能改變C端流量入口的分配機制。

業界對此有共識。智譜COO張帆也認爲,AI Agent有望革新智能設備的生態,手機+AI會變成隨身個人智能助理,PC+AI有機會成爲全新生產力工具,汽車+AI會打開汽車更大的想象空間。