國產大模型的機遇與挑戰

中青報·中青網見習記者 張仟煜 記者 樊未晨

隨着人工智能技術的不斷突破,大模型在各個領域的應用日益廣泛,並逐步成爲推動社會進步的重要力量。

近日,中國計算機學會(CCF)大模型論壇(FoLM)主題會議在北京舉辦。本次會議的主題爲“大模型技術進展與挑戰”,多名來自國內外的頂尖學者和業界精英,圍繞大模型技術的前沿動態、發展趨勢及技術挑戰等議題展開了深入探討。

提到大模型,學者們繞不開的一個詞是“超級對齊”(Super Alignment)。超級對齊是大模型自我進化、迭代的過程,通過反饋提升模型的能力。超級對齊旨在確保機器學習模型,特別是大語言模型與人類的目標、價值觀和道德規範保持高度一致的研究方向。

2023年7月,國家網信辦等七部門聯合公佈的《生成式人工智能服務管理暫行辦法》,明確提出堅持發展和安全並重、促進創新和依法治理相結合的原則,要求人工智能應當遵守法律、法規以及尊重社會公德和倫理道德,保障AI技術應用的安全、可靠、可控。

國內已有多家機構發佈了針對大模型對齊的高質量數據集,這些數據集月均下載量超過100萬,得到了全球大模型的真實驗證。這些數據集通過提供高質量的指令和回覆,旨在確保模型的行爲與人類價值觀一致,爲超級對齊的研究提供了有力支持。

華爲語音語義首席科學家劉羣認爲,超級對齊不僅要考慮與人類價值觀的對齊,還要關注與物理世界的對齊,最終實現模型的自我迭代與自我演化。“研究超級對齊,是讓語言模型真正爲我們服務,反映真正的客觀世界、真正的意識世界,這是它有用的地方。”劉羣說。

大模型對算力的需求巨大。清華大學電子工程系長聘教授汪玉在會上提到,訓練GPT-3的耗電量爲128.7萬度,相當於國內348個家庭一年的生活用電,但這僅僅是前期訓練所消耗的電量。據汪玉介紹,GPT每日訪問量約爲2.7億次,平均每次訪問5個問題,每月用在回答問題上的推理計算耗電量則是1872萬度。

“如果大模型真的能夠改變千行百業,算力規模可能會擴大100倍甚至1000倍。”汪玉說。

隨着大模型技術的不斷成熟,產業化和商業化進程也在不斷加速。越來越多的企業開始將大模型技術應用於實際業務中,推動了人工智能技術的落地和普及。“輸入一個短視頻,在生成創建新的3D對象的時候,可以模仿這個動作,實現4D動畫的創建。”清華大學人工智能研究院副院長朱軍重點介紹了Vidu視頻大模型的創新,包括一鍵生成32秒長視頻、發佈視頻/文本到音頻生成技術,以及Vidu4D的高效重建。

哈爾濱工業大學車萬翔教授提出了“推理粒度”框架來解釋思維鏈技術的機理,並通過實驗驗證了該框架的有效性,進一步指導了思維鏈策略的優化。

會議上,學者們就Maas模型展開了討論。Maas模型全稱Model as a Service(模型即服務),是一種將AI大模型轉化爲可服務化產品的新型商業模式,具有降低技術門檻、提高使用效率、彈性擴展等特點,廣泛應用於城市出行、跨城出行、旅遊出行等領域。

今年5月,智譜AI的GLM-3 Turbo模型(Maas模型的一種)從5元/百萬tokens,首次降至1元/百萬 tokens。GLM-4-Flash版本則降了10倍,現在每百萬tokens只需0.1元。

清華大學計算機系博士何家傲認爲,Maas模型的價格“會一直降下去的,模型訓練數量也會隨着技術進步不斷地減少”,同時,他也提到,更重要的問題還是在算力本身降價的情況下,大模型如何發揮更大的價值,尤其是其本身商業上的價值,是更值得去思考的一個問題。

來源:中國青年報客戶端