螞蟻集團董事長兼CEO井賢棟:專業智能體是大模型落地有效路徑

每經記者:塗穎浩 每經編輯:馬子卿

7月4日至6日,2024世界人工智能大會暨人工智能全球治理高級別會議(WAIC 2024)在上海召開。在7月4日的產業發展主論壇上,螞蟻集團董事長兼CEO井賢棟表示,專業智能體能夠破解通用大模型在嚴謹產業應用的關鍵難題,螞蟻集團正在攜手產業合作伙伴構建專業智能體生態,加速產業應用,推動服務升級。從實踐來看,專業智能體是大模型落地嚴謹產業的有效路徑。

井賢棟稱,通用大模型落地嚴謹產業面臨着三個“能力短板”:領域知識相對缺乏、複雜決策難以勝任以及對話交互不等於有效協同。專業智能體能夠破解通用大模型在嚴謹產業應用的關鍵難題,螞蟻集團正在攜手產業合作伙伴構建專業智能體生態,加速產業應用,推動服務升級。

大會期間,螞蟻集團首席技術官何徵宇在接受《每日經濟新聞》等媒體採訪時進一步表示,“整個社會都需要專業智能體涌現,我們積極擁抱專業智能體。”在其看來,隨着AI落地應用的不斷探索,AI不僅“有腦有嘴能對話”,未來智能化的用戶體驗將真正實現“有手有腳能辦事”。

智能服務技術落地應用

“我想點一杯星巴克的中杯冰拿鐵”,打開支付寶下拉進入智能助理,下達這樣的指令,AI便會進入小程序自動下單,用戶確認並付款後,就能到附近的線下門店取到咖啡。據悉,AI智能點單這一新功能,已在支付寶App開啓測試,首批支持星巴克、瑞幸、霸王茶姬、蜜雪冰城等11個茶飲品牌的支付寶小程序。

在移動互聯網時代,二維碼讓移動支付成爲每個人的生活日常。“在人工智能時代,我們也在探索,讓AI像掃碼支付一樣便利每個人的生活,讓AI技術發展的紅利惠及更多人。”井賢棟說。

AI點單功能背後到底是什麼技術?何徵宇告訴記者,這並不是一些基礎的應用程序編程口(API)打通的問題,實際上裡面嵌套了一個多模態的模型,當你說“我要點一杯拿鐵”的時候,在後臺你打開了星巴克的小程序,然後用多模態語言模型的識別能力識別出你要的是哪杯拿鐵,並且把那杯拿鐵點下去,它要去適配各種頁面的佈局。

基於多模態大模型的技術,讓智能助理具備屏幕感知與仿真執行能力,就像讓AI有了“眼睛”和“手腳”。過去用戶多次點擊才能完成的操作,現在只需要一句話,AI就能幫你辦好。“一些深刻的技術,其實藏在產品和服務後面。”何徵宇表示:“我們是希望產品說話,讓用戶感受到這款產品真正地能幫你做事,譬如點一杯咖啡,或者說幫你轉個賬。”

據瞭解,今年4月,支付寶智能助理在首頁開啓灰度測試。用戶通過其下達指令,就能迅速提供相關資訊,並一鍵直連支付寶生態內掛號、訂票、充話費等海量的數字服務,起到“App智能導航”的作用。

據支付寶介紹,這一名爲ACT(Transformer for Actions)的智能服務技術,目前仍在測試,未來將持續調整優化,並在快餐點單、醫院掛號、門票預訂等場景中落地應用。

構建專業智能體生態

目前,人工智能產業的飛速發展,催生了新的人機交互模式,核心便是AI大模型驅動的智能體(AI Agent)。

以自動駕駛汽車爲例,通過訓練大量的駕駛數據,智能體可以學會如何識別交通信號、避障和規劃行駛路線,從而實現自動駕駛的功能。因此,智能體的服務升級與互聯互通,是國內多家互聯網科技公司持續探索的重點。

在何徵宇看來,在互聯網時代,本質上是把模型作爲一個軟件,加上數據爲消費者提供可以選擇的服務。這是一個標準的模式,預測在垂類的大模型應用上對數據的需求會更多。

“就像你擁抱互聯網,會做個App,做個小程序一樣的邏輯,企業可以讓服務更靠近。因爲企業更瞭解他們的消費者,他們可以組裝成一個大模型服務,或者把它變成一個專業的智能體,這是我們想做的。”何徵宇認爲,整個社會會有大量的專業智能體涌現,支付寶想用更先進的技術爲用戶提供更好的服務。

對於通用大模型落地嚴謹產業的“能力短板”,井賢棟在演講中表示,爲了破解這些難題,螞蟻選擇了構建專業智能體生態的路徑,“從我們的實踐來看,專業智能體是大模型落地嚴謹產業的有效路徑”。截至目前,螞蟻通過與各行各業的深度合作,構建了生活、金融、醫療等領域的智能管家。