國內首個智能體可信互連工作組成立!超20家手機、大模型廠商組隊

智東西作者 程茜編輯 雲鵬

智東西12月19日報道,今天,國內首個智能體安全生態協作組織“IIFAA智能體可信互連工作組”宣佈成立,中國信通院、榮耀、OPPO、小米、華爲、智譜、字節、阿里、螞蟻、京東、中國移動、高通等二十餘家頭部科技企業和單位是該工作組首批成員。

AI智能體已經成爲大模型產業玩家的重點佈局賽道。蘋果、榮耀、vivo等手機終端廠商的智能體、智譜AI推出的AutoGLM、螞蟻集團推出的AI生活管家“支小寶”等AI智能體產品層出不窮,這使得用戶可以與設備或APP進行自然語言交互,快速實現訂票、點餐、打車、查詢附近吃喝玩樂等操作。

其中,多智能體系統協作的同時,會面臨智能體之間如何打通、數據隱私安全保護、用戶意圖數據的共享等諸多問題。IIFAA互聯網可信認證聯盟秘書長鄭亮提到,智能體之間的服務互聯最終要完成用戶指令,這中間涉及到意圖數據的共享傳遞和複雜任務拆解等必經流程,這些流程在沒有規範約束的情況下,就像開車沒有紅綠燈,非常容易滋生亂象。

未來,IIFAA智能體可信互連工作組將圍繞智能體可信認證、服務可信調用、數據可信流轉、用戶隱私與權益保護,制定跨智能體交互的相關標準等形式,爲智能體行業的發展提供更加規範健康的協作環境。

關於當下推動智能體可信互連的有潛力技術路線,IIFAA互聯網可信認證聯盟技術負責人萬小飛告訴智東西,有潛力的幾大技術場景包括應用於數據隱私流通中的匿名化技術、智能體業務之間的請求協同、端側App之間的可信流通、智能體協同之間的可信計算、分佈式數字身份技術等。

一、每天新增智能體2-8萬個,多智能體協作面臨四大風險

信通院泰爾終端實驗室信息安全部副主任傅山談道,AIGC構建的全新應用生態,變革了交互方式、產品形態、產業生態。

在交互方式層面,從人去被動接受App開發邏輯到機器適應人;產品形態層面,AI智能體具備強大的智能感知能力,AI手機、AI可穿戴設備等出現;產業生態層面出現了超級應用、原生AIGC應用、終端+AIGC形態等。

與此同時,多個具有自主性、交互性和協作性的智能體組成多智能體系統,可以在智能製造、智能交通、災害救援、智能物流、醫療領域等實現應用。但多智能體協作發展也帶來了不少的風險與挑戰。

主要的風險有四點,第一是AIGC發展應用過程涉及大量的個人信息處理活動,數據源獲取的方式包括主動爬取互聯網數據和被動,無法有效追溯和驗證其中的個人信息來源;第二是訓練數據包含大量用戶個人信息,互聯網的公開數據成爲訓練來源,數據脫敏、清洗過程中沒有有效識別關聯個人信息的數據會有泄漏風險;第三是大模型的幻覺,輸出的數據不可信、不可追溯;第四是模型的黑盒算法沒有辦法驗證。

傅山提到,據國內外主流智能體平臺運行情況來看,平臺平均每天可增加2-8萬個智能體。這一背景下會出現隱私侵害、過度數據收集、數據濫用、算法偏見、透明性不足、責任歸屬等風險。

基於此,信通院構建了生成式AI產品和服務用戶權益保護標準體系。在數據獲取和用戶授權的矛盾上,目前通過匿名化技術的手段,可以提升個人信息數據的可用性。

匿名化技術可以應用於端側處理、大模型訓練、公開報告中,通過匿名化技術保證數據只在端到端場景交互,同時還能對統計報告中的公開數據進行匿名化技術,並公開發布。

二、多智能體協作案例GLM-PC,敏感信息操作經用戶二次確認

智譜AI此前發佈的GLM-PC,就是多智能體協作的典型案例。

CogAgent是依靠視覺對屏幕進行感知,然後獲取屏幕上的界面元素信息的模型。智譜AI爲其訓練了一個可以接受1120×1120分辨率的圖形輸入的高分辨率的編碼器,使得高分辨率圖像特徵,通過多個交叉注意力和視覺語言解碼器相互聯合,共同輸出最終的結果。

新增了GUI界面元素的指代生成和指代理解相關預訓練任務,指代生成指的是讓模型根據屏幕截圖和給定區域生成相關自然語言描述,指代理解指模型根據屏幕截圖和自然語言描述計算這個被描述的元素所在的區域。

這兩個任務分別對應的是界面上的元素是什麼、界面上的元素在哪個位置。

智譜AI收集了汽車、手機、電腦等在不同分辨率、不同平臺在內的包含一級界面元素量的百萬量級屏幕截圖數據,並採用多尺度訓練策略和多樣數據增強策略,提升了CogAgent模型GUI理解的能力,使其可以準確識別界面上的圖標、按鈕、文本。

此外,爲了提高CogAgent的模型能力,其設計了目標拆解、長短程規劃、界面理解、任務執行、狀態判斷等一系列訓練任務。

CogAgent的行爲包括兩部分,模仿人類操作行爲和LLM原生行爲。這也包括其訓練的三個思路,分別爲被動模仿人的行爲、交互學習、主動探索。

GLM-PC是一個開箱即用電腦智能體,用戶只需要在文本框中輸入任務的內容,然後按下回車就可以。它可以自己啓動電腦上所需要的應用,像人一樣去根據指令去執行一個長鏈條跨應用的操作,然後將最後的執行結果返回給用戶。

在安全方面,GLM-PC會將即時通訊消息,文件發送、刪除、清空,支付、轉賬,用戶賬號管理、密碼輸入等操作由用戶進行二次確認;智能體的虛擬屏幕可以不影響人類使用自己的物理屏幕,用戶能夠查看隱形屏幕上GLM-PC的工作情況;第三是智譜AI在探索本地端側模型的合作,對用戶的個人隱私數據進行預處理等。

結語:AI智能體生態繁榮,可信互連工作組先行一步

AI智能體的能力在不斷增強,業界諸多企業正在將文本、圖像、語音等多種模態數據相結合,使智能體能夠更全面地感知和理解環境,進而做出更準確、更貼近人類認知方式的決策和響應,如智譜AutoGLM可以自主執行超過50步的長步驟操作,並能夠跨App執行任務,像發送紅包、查詢並下單外賣、採購食材等複雜任務。

可以預見,未來,AI智能體將極大地改變人們與AI的交互方式,但在這一背景下,用戶的數據隱私與安全、智能體與不同系統和設備間的交互協同工作等挑戰也不容忽視,在此背景下,IIFAA智能體可信互連工作組的成立,或許可以爲未來有效避免由於缺乏統一標準而可能導致的智能體惡意攻擊等諸多風險提供一條可行的解決路徑。