外媒:谷歌發佈Gemini更多是爲營銷 仍落後於GPT-4

12月8日消息,本週三谷歌發佈了最新的人工智能模型Gemini。谷歌聲稱該模型在一系列智力測試中的表現優於OpenAI的GPT-4模型和“專家級”人類,但從技術指標來看,Gemini僅比OpenAI推出已有八個月的GPT-4模型好一點點。

在上述消息推動下,美股週四收盤,谷歌漲5.31%,報136.93美元,市值1.7萬億美元。

一年前,谷歌被OpenAI的聊天機器人ChatGPT打了個措手不及,此後就一直渴望描繪出自己在人工智能領域快速進步的畫面。本週三谷歌突然提前發佈了新的人工智能模型Gemini,可以發現魔術中的技巧,並在會計認證考試中取得好成績。谷歌發佈的演示視頻也在社交媒體上引起了轟動,但從技術角度來看,谷歌仍然在追趕OpenAI。

從谷歌Gemini與OpenAI頂級模型GPT-4的性能對比來看,谷歌最強大的Gemini Ultra在高中物理、專業法律測試以及道德場景等大多數基準測試中都優於GPT-4。要知道,當前的人工智能競賽幾乎完全是由這些能力定義的。

但在大多數基準測試中,Gemini Ultra只比GPT-4高出幾個百分點。換句話說,谷歌所謂的頂級人工智能模型較OpenAI至少一年前完成的工作效果提升有限。

如果Gemini Ultra真如谷歌所說那樣在明年1月初發布,那麼可能不會在頂級人工智能模型的頭把交椅上呆太久時間。在谷歌努力追趕OpenAI的過程中,後者有將近一年的時間來開發新一代人工智能模型GPT-5。

谷歌發佈在社交媒體X上的演示視頻乍一看令人印象深刻。谷歌的人工智能模型能夠追蹤塑料杯下的紙球,或者在勾勒出圖片輪廓之前就推斷出會是一隻螃蟹,這些都顯示出谷歌DeepMind人工智能實驗室多年來訓練的強大推理能力。這是其他人工智能模型所缺少的功能。但視頻中展示的許多其他功能並不是谷歌獨有的,ChatGPT Plus3也可以做得到,沃頓商學院教授伊森·莫里克(Ethan Mollick)就用實驗證實了這一點。

此外,谷歌也承認演示視頻被編輯過。該公司在視頻描述中說:“爲了達到演示效果,我們縮短了延遲時間,Gemini的輸出也壓縮了。”這意味着模型做出響應所花費的時間實際上要比視頻中展示的長。

事實上演示也不是實時的,也沒有通過語音交互完成。谷歌的一位發言人在談到這段視頻時表示,這段視頻是“使用視頻中的靜止圖像幀,並通過文本提示”製作出來的。有網站展示了其他人如何通過手勢、繪畫或其他物體的照片與Gemini互動。換句話說,演示視頻中的聲音只是在解釋給Gemini做了哪些人工提示,Gemini輸出的依舊是靜態圖片。這似乎與谷歌所謂一個人可以與Gemini進行流暢對話、模型可以實時觀察周圍世界並做出反應的暗示完全不同。

演示視頻也沒有說明展示是Gemini Ultra人工智能模型。這些細節表明,谷歌更多是在進行營銷,希望人們記住自己擁有世界上最大的人工智能研究團隊之一,並且比其他任何人都能獲得更多數據。正如谷歌在週三所做的那樣,公司希望在Chrome、Android和Pixel手機上推出適用於終端設備的Gemini模型,提醒人們公司的部署網絡規模有多龐大。

但在科技行業,無處不在並不總是看起來那麼有優勢。早期的手機霸主諾基亞(和黑莓)就經歷過慘痛教訓,蘋果用功能更強大、更直觀的iPhone搶走了它們的市場。在軟件領域,商業上的成功往往來自於性能最好的系統。

幾乎可以肯定的是,谷歌這番操作是爲了利用OpenAI最近的動盪局勢。據報道,當OpenAI董事會暫時罷免首席執行官薩姆·奧特曼(Sam Altman),使公司的未來發展受到質疑時,谷歌迅速發起了一場營銷活動,說服OpenAI企業客戶轉向谷歌。現在,隨着Gemini的發佈,谷歌似乎正在利用這種不確定性。

但演示的效果有限。谷歌之前已經展示過新技術,但沒有任何進展。到目前爲止,谷歌的龐大架構和層疊複雜的產品經理設置使其無法像OpenAI那樣靈活發佈產品。隨着全社會努力應對人工智能的變革性影響,谷歌的最新舉措並不是一件壞事,但效果有待觀察。可以肯定的是,谷歌仍然在後面努力追趕。(辰辰)