谷歌AI負責人迷茫:怎麼減少內鬥和人才流失,拿什麼趕超OpenAI

4月9日消息,據美媒theinformation報道,谷歌人工智能部門的主管德米斯·哈薩比斯(Demis Hassabis)對公司在推動人工智能商業化上的新策略深表失望,並曾在兩個AI部門合併成立新實驗室時考慮過離職。他向同事透露,谷歌在追趕OpenAI的Sora項目方面可能面臨着重重挑戰。

以下是翻譯內容

今年3月初,在度過數週的艱難時刻之後,谷歌AI部門Google DeepMind負責人哈薩比斯試圖重振團隊士氣。此時,谷歌剛發佈Gemini,這款基於哈薩比斯團隊研究的聊天機器人,被視爲谷歌與OpenAI ChatGPT競爭的有力武器。然而,Gemini因錯誤回答用戶問題而遭到公衆嘲諷。

據知情人士透露,哈薩比斯在一次團隊會議上強調,他們負責開發谷歌內部的底層AI技術,而把這些技術交給億萬用戶的責任則由公司其他同事承擔。他還提到,爲避免再出現尷尬,谷歌員工需要加強溝通。

這一事件也暴露出谷歌在AI領域的內部矛盾尚未解決。哈薩比斯領導的DeepMind與另一AI實驗室谷歌大腦(Google Brain)之間長期存在着摩擦。一年前,爲整合資源,谷歌匆忙將這兩個實驗室合併,並交由哈薩比斯統領,但二者之間的緊張關係並未得到緩解。

與此同時,在這家擁有18.2萬名員工的科技巨頭中,哈薩比斯正在適應新職位所帶來的挑戰。DeepMind在谷歌內部曾享有一定獨立性,專注AI研究而非商業化。而現在,他需與其他領導者緊密合作,把DeepMind的技術轉化爲產品。據兩位近期與他交流的人士透露,這種新的工作模式讓這位富有遠見的創業者感到沮喪。

爲提升純AI研究在谷歌的影響力,哈薩比斯近期進行了團隊重組。3月,他重新調整了管理團隊,讓更多研究主管能夠直接與他溝通。如今,普什米特·科利(Pushmeet Kohli)、賴亞·哈德塞爾(Raia Hadsell)以及祖賓·加赫拉馬尼(Zoubin Ghahramani)等負責不同AI領域的谷歌高管都直接向哈薩比斯彙報工作,而非之前的科雷·卡武克喬盧(Koray Kavukcuoglu)。卡武克喬盧雖然曾負責監督規模龐大的Gemini項目,但如今他獲得了一個新的頭銜——谷歌DeepMind首席技術官。

DeepMind發言人阿曼達·卡爾(Amanda Carl)表示,谷歌大腦與DeepMind的合併順利,最新重組有助提高效率。哈薩比斯在全體會議上的評論旨在闡明DeepMind在技術開發中的角色,並非推卸責任。她否認哈薩比斯對新工作感到沮喪,並稱:“近30年來,DeepMind一直是哈薩比斯的夢想,谷歌依然是我們實現使命的完美夥伴。”

從紙面上講,哈薩比斯已經擁有擊敗OpenAI所需的所有關鍵要素。

他領導的團隊由頂尖機器學習研究人員組成,但OpenAI和其他公司一直試圖挖角他的精英成員。他還管理一個專門團隊,負責將DeepMind的科學成果整合到Gemini項目中。然而,直接負責Gemini項目的關鍵人員變動頻繁,包括約阿尼斯·安東盧(Ioannis Antonglou)和阿米莉亞·格萊澤(Amelia Glaese)在內的多位高級員工已離職,轉投OpenAI或自立門戶。

谷歌正積極研發下一波AI產品。Gemini項目中,一個專門團隊正在研發能自動執行計算機任務的智能主體,甚至吸納了知名AI初創公司Adept的聯合創始人安莫爾·古拉蒂(Anmol Gulati)。但DeepMind也在該領域失去了一些核心人才,如資深計算機科學家達恩·威爾斯查(Daan wierstra),他在谷歌收購DeepMind之前就加入了該公司,然而今年早些時候,他選擇了離開,並加入了由DeepMind前研究人員創立的Holistic。

DeepMind背後還有谷歌龐大的數據中心網絡和數十億產品用戶的支持,爲推廣新AI產品提供了廣闊的平臺。有傳言稱,谷歌與蘋果正就增強iPhone功能(例如Siri)進行合作談判,若協議達成,哈薩比斯的產品將有機會接觸到更多用戶。

技術上,DeepMind正在縮小與OpenAI的差距。儘管Gemini在某些方面優於OpenAI的GPT-4,但GPT-4的模型較早推出,使OpenAI能收集到大量有價值的數據來優化模型。同時,OpenAI的文生視頻服務Sora引起極大關注,哈薩比斯近期對一位同事表示,他認爲谷歌在這一領域趕超對手尤爲困難。

一家大公司

2022年11月,ChatGPT的問世在人工智能界引發巨大反響,給谷歌帶來了震撼。

長期以來,谷歌一直擁有全球領先的兩支機器學習隊伍。谷歌大腦不僅是大語言模型的開拓者,也是Transformer(轉換器)技術的締造者,正是這項技術成爲了構建ChatGPT的核心。同時,DeepMind在AI領域取得了舉世聞名的成就,其開發的人工智能系統在國際象棋和圍棋等複雜遊戲中屢獲佳績。然而,這兩個團隊在共享代碼和計算資源等方面經常發生衝突。更重要的是,它們都沒能推出像OpenAI那樣能夠引爆網絡的產品。

ChatGPT發佈幾周後,谷歌CEO桑達爾·皮查伊(Sundar Pichai)指令谷歌大腦和DeepMind的管理層放下各自的分歧,聯手開發名爲Gemini的AI模型。

同時,皮查伊還開始準備更大的計劃——合併這兩大AI團隊。然而,哈薩比斯對這次重組顯得不太熱情。他私下向一位同事透露,對領導新合併部門並不自信,甚至考慮離開谷歌,籌資創立一個全新的研究實驗室。這樣的舉動無疑將使他從日常繁瑣的管理事務中解脫出來,專注於自己鍾愛的研究工作。

但當皮查伊於2023年4月正式命令合併兩個團隊時,哈薩比斯還是接受了新職務。在當月的一次會議上,他向員工詳細說明了合併的情況,並強調了合併對DeepMind員工的諸多好處,比如更廣泛的服務器訪問權限,以及兩支團隊研究人員合作的機會。

然而,據會議中的三位參與者透露,哈薩比斯的發言顯得缺乏熱情,似乎對合並並不太感興趣。這讓許多谷歌研究人員大感意外,因爲就在幾個月前,哈薩比斯還在努力限制DeepMind和谷歌大腦之間的合作僅在Gemini項目上進行。

這次重組並沒有爲谷歌的AI領域帶來期待中的和諧,新團隊在資源分配上依然存在衝突。谷歌把原本致力於通用人工智能(AGI)探索性研究的員工調整到了Gemini項目,該項目迅速擴大到約1000名員工。同時,公司還完全關閉了一些AI項目,讓很多內部員工倍感沮喪。

與此同時,OpenAI繼續從谷歌挖走關鍵AI人才,這讓哈薩比斯很不高興。據最近與他交談的一位人士透露,哈薩比斯抱怨谷歌的薪酬政策無法阻止研究人員被這家初創公司豐厚的待遇所吸引。之後,DeepMind提高了研究人員的薪資,部分得益於一個特別的股票獎勵計劃。然而,哈薩比斯對於同事們在媒體上過度渲染一些關鍵人員的離職事件表示失望。

在展示AI研究成果的壓力下,哈薩比斯和他的團隊可能過度誇大了他們的成就。去年12月,谷歌發佈了備受關注的Gemini。然而,其視頻演示的誤導性引發了批評,爲這項技術蒙上了陰影。視頻中令人印象深刻的是,模型似乎能夠即時迴應語音提示,但實際上存在延遲,而且視頻所示的生成提示與實際生成的迴應用詞不一。據一位參與者透露,哈薩比斯在隨後的全公司會議上表示,他希望這次演示能“鼓舞人心”,展示這項技術最終能達到的目標。

另一個項目AlphaGeometry也遭受類似批評。今年1月,DeepMind宣稱該AI系統能“以接近國際數學奧賽金牌水平解決複雜幾何問題”。然而,研究自動推理的紐約大學教授歐內斯特·戴維斯(Ernest Davis)指出,這未提及其明顯的侷限性。例如,該AI只能處理二維幾何形狀,對面積等概念理解有限。

DeepMind的早期投資者弗蘭克·米漢(Frank Meehan)對當前情況表示擔憂,認爲這些爭議分散了哈薩比斯對AGI研究的關注,可能是其“持續感到挫敗”的原因。他還指出,OpenAI在生成引人注目的視頻方面取得顯著進展,而谷歌在一些圖像生成問題上卻遇到難題。

然而,哈薩比斯依然堅信AGI的到來。參與Gemini項目的一位人士透露,爲了更好地衡量哈薩比斯長期目標的進展,DeepMind正在開發針對AGI的新基準。另有人士稱,團隊希望Gemini不僅能強化谷歌產品,也能幫助他們推動研究進步,提出新方法和算法。

紐約大學心理學和神經科學教授加里·馬庫斯(Gary Marcus),曾將AI初創公司賣給優步,他對哈薩比斯的能力充滿信心。他認爲哈薩比斯能在DeepMind的研究和爲谷歌產品提供動力間找到平衡。“如果有誰能把事情做成想要的樣子,那就是哈薩比斯。但谷歌是大公司,壓力自然大。我們只需耐心等待,看看最終結果如何。”(小小)