馬上消金CTO蔣寧:金融大模型向智能體、輕量化、全價值鏈創新演進

在大模型火爆的兩年內,馬上消費金融正在實踐中不斷通過 “小步快跑”,以實現金融大模型的快速演進。

11月28日,在重慶舉辦的數字生態夥伴創新大會上,馬上消費金融CTO蔣寧在接受採訪時表示,經過兩年多以來的探索實踐,對大模型的認識更加深刻,原本業界普遍認爲大模型必須滿足巨大的參數,有着高昂訓練成本,然而實踐得出的結論卻並非如此。

他表示,金融大模型可以實現“輕量化應用”,在降低成本與提高效率之間尋求最優解,也可以將金融大模型從單場景創新演進成爲零售金融全價值鏈大模型,乃至應用於更廣泛社會生活的領域;最後,金融大模型正在演進成爲“智能體”,推理能力而非數據訓練,將成爲大模型具備的更重要的能力。

金融大模型“溢出效應”

蔣寧表示,1.0版本的天鏡大模型還只是一個局部的創新,是由場景驅動的,主要訓練了人機交互來解決金融客服、營銷等場景的應用。當時是基於2億用戶,訓練了約100P數據,實現了100億的交易額。

他稱,但在1.0以後,一直在思考在金融這個長價值鏈的產業中,大模型是否能在包括營銷、風控、消費者權益保護,甚至客戶體驗、合規等場景進行應用,因此做了深度探索。

蔣寧表示,例如,在反金融黑灰產領域,馬上消金應用了多項大模型技術來進行高效反黑。可以在貸款人允許下記錄聲紋,如果後續交互過程中,發現他的聲音發生變化的時候,就有理由懷疑,這可能不是他本人的意思表達從而識別黑灰產。此外,整合多模態大模型還可以識別借款人的周邊的環境、地址、網絡地址等,再結合複雜網絡技術,隱私計算技術,多種技術結合,就形成了打擊黑產的科技能力。

除了金融領域,馬上消費人工智能研究院院長陸全也表示,馬上消金也把在金融領域積累的能力又反哺到國家重大項目裡,通過參與社會生態建設,讓人工智能團隊的知識、經驗能在更廣泛的領域得到鍛鍊提升機會。

馬上消費人工智能研究院鄧偉洪也表示,目前,公司在養老機器人上做了比較大的投入,可以滿足老年人在社交、康養方面的需求。他表示,養老機器人未來應用場景豐富,一是社交陪伴場景,可以做一個數字人跟老年人進行心理疏導。二是遊戲娛樂場景,可以給老人開發認知小遊戲,鍛鍊他們的認知功能,也可以給他們放一些好看的電影。三是安全觀察場景,老年人摔倒是一個很大的風險,可以做一些監護。四是未來當機器人可以做到自由運動,可以給老人做一些家務,給老人送藥。

從單體大模型到“智能體”

在採訪中,馬上消費金融人工智能研究院院長陸全表示,在過去兩年的金融大模型實踐過程中,第一個發現就是光靠單一、單體基礎大模型,或者說單體大模型不能適應產業界絕大多數應用,因此,馬上的天鏡從單體大模型,也逐漸變成了目前的“邏輯”與“記憶”分離的“智能體”。

陸全表示,所謂“智能體”,其背後包括了多個大模型和小模型,通過把這些模型組合在一起,多個模型之間互相協作,來完成一連串的複雜任務。

他表示,發現金融多個領域的應用都需要多智能體系統來處理,這是因爲單體大模型能力相當有限,就像一個人不可能是文科狀元,還是理科狀元,還懂管理。而在智能體情況下,大模型就可以相互配合,把邏輯和數據分析分離,讓大模型做專業上最擅長的事情。

陸全稱,這意味着,智能體在某些價值鏈上天然就具備泛化能力,可以移植到類似場景,比如防僞,可能所有場景的要求是一致的。當智能體掌握了某個邏輯,且在業務形態比較接近的情況下,就會更具備泛化應用的能力。

高成本到“輕量化”

蔣寧表示,在實踐中,對大模型的認知也在逐步深入。在天鏡大模型1.0時代,普遍認爲需要建設一個高成本、參數巨大的大模型來訓練,才能讓模型能夠發揮效力。然而,當大模型應用從單場景向全價值鏈演進,就發現可能有些場景參數沒有那麼大的時候,也可以保證在很短時間內可以得出正確答案,而有些場景非常注重嚴密的邏輯,就可能需要更大的參數。因此,2.0版本的天鏡大模型正在向更輕量,更小型化發展,根據不同場景選擇能夠起效的最小參數,來實現對成本的有效地控制。

他還表示,此前,大模型創新成本比較貴,一張算力卡初始階段只能支持50個機器人和人的交互,而現在通過大模型各種調優技術輕量化,一張同樣的卡可以支持10倍以上的交互。

陸全也表示,過去大家一直把更多的算力都關注在基礎大模型的訓練上,而現在,馬上消費金融的大模型絕大部分算力都消耗在推理上,其次纔是消耗在持續訓練上。目前,一些基礎開源大模型發展得很快,金融垂類模型只需要在它的基礎上做微調就可以快速吃到紅利;另一方面,是發現在實際過程中,並沒有那麼大的必要來做基礎模型的精益求精。

陸全表示,目前,公司的金融大模型天鏡在銷售上已經爲公司帶來了盈利,而且還在探索建立一套商業模式。目前,天鏡大模型正在通過“小步快跑”,不斷證明自身的盈利能力。