谷歌發佈人工智能推理模型:可明確表達自己想法
鞭牛士報道,12月20日消息,據外電報道,谷歌發佈了所謂的新型推理人工智能模型——但它處於實驗階段,從我們的簡短測試來看,它肯定還有改進空間。
新模型名爲 Gemini 2.0 Flash Thinking Experimental(名字有點拗口),可在谷歌的 AI 原型平臺AI Studio中使用。模型卡將其描述爲最適合多模態理解、推理和編碼,能夠推理編程、數學和物理等領域最複雜的問題。
在 X 上的一篇帖子中,AI Studio 產品負責人 Logan Kilpatrick 稱 Gemini 2.0 Flash Thinking Experimental 是谷歌推理之旅的第一步。
谷歌人工智能研究部門 Google DeepMind 的首席科學家 Jeff Dean 也在自己的帖子中表示,Gemini 2.0 Flash Thinking Experimental 經過訓練,可以使用思維來強化其推理能力。
「當我們增加推理時間計算時,我們看到了有希望的結果。」迪恩說,他指的是在考慮問題時運行模型所使用的計算量。
Gemini 2.0 Flash Thinking Experimental建立在谷歌最近發佈的Gemini 2.0 Flash模型之上,其設計與 OpenAI 的o1和其他所謂的推理模型 類似。與大多數人工智能不同,推理模型可以有效地進行自我事實覈查,這有助於它們避免一些通常會絆倒人工智能模型的陷阱。
缺點是,推理模型通常需要更長的時間(通常需要幾秒到幾分鐘)才能得出解決方案。
給出提示後,Gemini 2.0 閃電思維實驗會暫停一下再做出反應,考慮一系列相關提示,並在此過程中解釋其推理。一段時間後,該模型會總結出它認爲最準確的答案。
事情本該如此。當我問 Gemini 2.0 Flash Thinking Experimental 單詞strawberry中有多少個 R 時,它回答兩個。
在 o1 發佈後,競爭對手人工智能實驗室(不僅僅是谷歌) 紛紛推出了大量推理模型。11 月初,由量化交易員資助的人工智能研究公司 DeepSeek 發佈了其首個推理模型DeepSeek-R1的預覽版。同月,阿里巴巴的 Qwen 團隊 公佈了 其聲稱的首個 o1公開挑戰者。
彭博社10 月份報道稱,谷歌有多個團隊正在開發推理模型。The Information 隨後在 11 月份的報道中透露,該公司至少有 200 名研究人員專注於這項技術。
是什麼打開了推理模型的閘門?首先,就是尋找改進生成式人工智能的新方法。正如媒體最近 報道的那樣,用於擴展模型的強力技術不再能產生曾經有過的改進效果。
並非所有人都相信推理模型是最佳的發展方向。首先,它們往往價格昂貴,因爲運行它們需要大量的計算能力。儘管到目前爲止,它們在基準測試中表現良好,但尚不清楚推理模型是否能保持這種進步速度。