歐洲人工智能,尷尬與焦慮籠罩

歐洲人工智能產業在全球分工裡找到了自己的定位:開會。

ChatGPT橫空出世的2023年,歐洲能喊得上名號的全球性AI峰會有近20個,大約是美國的3倍、中國的5倍[1]。在人工智能權威雜誌(AI Magazine)年末總結的“2023 Top10 AI Events”中,歐洲承辦的會議佔比高達70%[2]。

如此高密度的文山會海,顯性成果只有一個——推出了以《人工智能法案》爲代表的一系列管理辦法。

一系列監管舉措逗樂了大洋對岸的美國人,紐約研究機構CB Insights的首席執行官表示,歐洲現在擁有的AI法規比像樣的AI公司還要多:“衷心祝賀歐盟制定了具有里程碑意義的AI立法,繼續努力做一個技術創新的空心市場吧[3]”。

拋開諷刺挖苦的成分,歐洲在人工智能領域的建樹的確遜色,獨角獸公司的稀有程度也堪比野生雪豹。

去年召開的VivaTech峰會上,法國總統馬克龍就點名表揚了一家來自革命老區巴黎的AI公司Mistral,稱其爲“法國的OpenAI”。

Mistral的知名度不如OpenAI,但包括英偉達、Salesforce和谷歌前任董事長施密特在內的這些投資者,暗示了它的份量。去年底,Mistral在推特上低調發布了其開源模型Mixtral 8x7B,迅速引爆了各大開發者社羣。

但這樣一家被馬克龍稱爲“歐洲的希望”的公司,它的每一個橫截面都折射着歐洲人工智能產業的尷尬。

大學生支援家鄉建設

去年12月,Mistral在A輪融資中斬獲20億美元估值,震驚歐洲投資圈。

這家公司2023年5月才宣告成立,初創團隊只有六個人,靠着7頁PPT拿下了1.13億美元的種子輪投資。有位早期投資人將Mistral視爲“歐洲的尤里卡時刻”,意思是歐洲人非常善於搞科研,但商業化水平差勁,而Mistral將改變這一切。

Mistral之所以備受矚目,核心在於其大模型的“混合專家模式”的MoE(Mixture of Experts)架構。

MoE架構主要由兩個關鍵部分組成:專家網絡和門控機制。

(1)專家網絡:傳統Tranformer架構的FFN(前饋網絡)層是一個完全連接的神經網絡,MoE架構的FFN層則劃分成稀疏性的神經網絡,這些被稱之爲“專家”的小FFN,每個都有自己的權重和激活函數,它們並行工作、專注於處理特定類型的信息。

(2)門控機制:用來決定每個token被髮送到哪個專家網絡的調配器,比如下圖中“More”這個token在輸入概率(p)爲0.65時被分配到FFN2,而“Parameters”則在輸入概率(p)爲0.8時被分配到了FFN1。

通俗一些說,經典的Tranformer架構在運行時,無論下達的推理指令是什麼,都會把系統中所有的員工全部調動起來問個遍,頗有些勞民傷財;MoE架構則是“術業有專攻”,把不同的問題交給相應領域的專家來解決。

這意味着MoE架構在推理時,最大程度實現了性能和參數規模之間的平衡,節省了科技大廠談之色變的算力成本。

正因如此,Mistral 8x7B模型一經問世,讓Meta的LLaMA2大模型都有些黯然失色,其背後是MoE架構對Transformer的創新性改造。

近期,Mistral又發佈了性能逼近GPT-4的超大杯模型Mistral Large,雖然並未開源,但上線閉源大模型,意味着Mistral正式加入AI的商業化競爭。

Mistral在領英的頁面也顯示,近期從事商務拓展的員工比例大幅增加,已佔其整體的近40%[4]。

按照其CEO Arthur Mensch的說法,Mistral Large的訓練成本僅爲2000萬美元左右,而OpenAI的模型則超過5000萬美元。

對於一家如此罕見的科技新貴,歐洲各國政府自然是捧在手裡怕摔了,在監管政策上也對Mistral大開綠燈,採用了“AI基礎模型豁免,AI應用重點監管”的分層處理思路。這意味着Mistral的產品僅需承擔有限的披露義務。

然而,舉歐洲上下扶持的Mistral,本質上卻是一家徹頭徹尾的美國公司。

美國的錢,美國的人,美國的市場

與“註冊地”這個法律層面證明公司國籍的事實信息相比,人才、資本、市場三大經營要素也許更能代表一家企業的內核。從這個意義上講,Mistral的確更像一家美國公司。

Guillaume Lample(左)、Arthur Mensch(中) 、Timothée Lacroix (右)

Mistral的三位聯合創始人人生經歷非常雷同:都是土生土長的巴黎人,都有在美國公司的工作經驗,也都有着與程序員身份不符的髮量。

CEO Arthur Mensch在巴黎讀到了博士後,與另外兩位創始人彼此相識於巴黎求學生涯。博士期間,Arthur發表了深度學習領域大作《結構性預測與注意力中的可微分動態編程》。

依靠這篇論文,Arthur一畢業就加入了DeepMind巴黎團隊,從事語言模型的開發。

首席科學家Guillaume Lample與首席技術官Timothee Lacroix則在畢業後遠赴美國鍍金,轉崗至Meta位於巴黎的AI分支機構,主攻大模型項目。Meta的開源大模型LLaMA,就由Guillaume Lample領銜開發。

CEO Arthur並非人們眼中典型技術極客的樣子,他是個狂熱的馬拉松愛好者,對硅谷大公司的官僚文化深惡痛絕。這讓三個姓氏連起來就是“L.L.M(大語言模型)”縮寫的青年,命運再次交織在一起。

Mistral的“含美量”不僅體現在創始團隊的履歷,大部分Mistral員工的上一份工作,也在美國科技公司位於歐洲的分支機構。

而在Mistral成立八個月內的兩次融資中,背後的核心力量也是美國的風投基金和產業資本。

Mistral的走紅雖然吸引了一衆歐洲本土的Old Money捧場,包括菲亞特背後的阿涅利家族、老佛爺百貨的家族辦公室Motier Ventures、英國風投基金First Minute Capital。

但在1.13億美元的種子投資裡,領投方其實是美國老牌基金Lightspeed。

而在A輪融資中,另一家老牌基金a16z,與微軟、英偉達和Salesforce這些美國產業資本搶盡了風頭,Mistral不僅是用了微軟的Azure雲服務,還與亞馬遜達成協議,使其成爲Amazon Bedrock客戶的基礎模型開發商。

儘管CEO Arthur曾多次公開表示Mistral的主要目標市場是歐洲,並強調歐洲在人工智能領域的獨特優勢。但同樣身不由己的是,Mistral目前一半的客戶都來自美國市場。

Mistral的軌跡似乎重複着某種輪迴。憑藉AlphaGo紅極一時的DeepMind誕生在英國,但在創辦第四年就被谷歌收入囊中。

曾經的“英偉達殺手”——英國芯片公司Graphcore受困於財務壓力;文生圖模型Stable Diffusion背後的Stability AI其實是家英國公司,但似乎所有人都默認它是美國公司。

歐洲科技公司的理想似乎總是由美國最後買單。歷史的前車之鑑高懸在Mistral頭頂,時刻提醒着它難以擺脫的命運。

宿命般的輪迴

2018年4月,傑夫·辛頓、約書亞·本吉奧,以及德國計算機科學家尤爾根等200多名學者,共同簽署了一封聯名公開信,尖銳地提出了一個警告:歐洲在人工智能領域正在遠遠落後於美國和中國。

當時,OpenAI剛剛發佈基於Transformer的GPT模型,眼看着人工智能在美國加速,歐洲成立了一個旨在打造全球人工智能強國的研究機構ELLIS應對。但信中的警告還是成爲了預言,猜中了生成式人工智能的全球競爭格局。

歐洲並不缺少頂尖的高校和人才,“人工智能三巨頭”傑弗裡·辛頓、約書亞·本吉奧和楊立昆都是如假包換的歐洲人。歐洲人工智能遇到的的真正問題,是軟件和互聯網這門“前置產業”的缺位。

2012年,在斯坦福教書的吳恩達教授以顧問的身份進入谷歌,主持The Cat Neurons項目(即“谷歌貓”)的研究。這個項目動用了遍佈谷歌各個數據中心的16000個CPU來訓練(內部以過於複雜和成本高爲由拒絕使用GPU),這是當時科技公司能擁有的最大規模的算力。

谷歌之所以興建大規模的數據中心,是因爲大量的互聯網公司都是谷歌雲服務的客戶。如今大模型的“萬模之母”Transformer架構,同樣來自谷歌。

就像不能脫離電商談直播帶貨一樣,英偉達在AI時代大殺四方,是因爲一大批遊戲玩家給黃總報銷過研發成本;歐洲汽車工業的底子,也是因爲斯柯達在1895年就開始造大炮了。

人工智能、互聯網和軟件,都屬於“計算機科學”這門大產業的子集。美國人工智能的繁榮,是因爲微軟、谷歌和亞馬遜在互聯網時代爲人工智能儲備了大量的“人才預備役”。

高等教育可以培養人才,但吸引人才靠的是產業的繁榮。豐田的電動車工程師跳槽去比亞迪,總不會是因爲能在深圳交社保吧。

與美國互聯網的Magnificent 7、中國的BAT相比,歐洲的互聯網產業幾乎是一片鹽鹼地。

全球市值最高的50家互聯網公司中,中美兩國佔據了39家,歐洲公司只擠進了一家Spotify。而歐洲最大的互聯網獨角獸,居然是估值180億美元的Onlyfans[5]。

互聯網產業的荒蕪,造成了人工智能“人才蓄水池”的缺失。

“人工智能三巨頭”中,辛頓和本吉奧選擇移民加拿大,前者把公司賣給了谷歌,後者進入蒙特利爾大學任教。楊立昆則在紐約大學教書,後來跳槽到了Meta。

AGI噴涌的2023年,美國風險投資支出的主力是以Magnificent 7爲代表的科技公司,其規模是美國其他投資機構的兩倍、更是歐洲的近六倍[6]。歐洲並不缺錢,但從Mistral的融資就能看出,Old Money們更願意扮演錦上添花的角色。

對前沿技術的投資,本質上是上一個時代的成功者,面對下一個時代來臨時的避險行爲。只是愛馬仕和LV不需要擔心這個問題。

尾聲

人工智能產業的中美競爭一直是輿論場熱度最高的話題,中國公司則常以追趕者的身份亮相。但在怒其不爭之餘,我們常常忽略,成爲追趕者也是有門檻的。

繁榮的互聯網和消費電子產業帶動了芯片設計、數據中心、雲計算等一系列細分門類的建立,它們都是發展人工智能重要的基礎設施。同時,它爲相關人才提供了一個重要的培養與輸送的體系。

ChatGPT橫空出世時,“爲什麼又是美國”的聲音此起彼伏。但如果把時間拉長,會發現從晶體管、集成電路,到Unix、x86架構,再到如今的機器學習,美國學界和產業界幾乎都是領跑者的角色。

關於美國“產業空心化”的討論不絕於耳,但以軟件爲核心的計算機科學這門產業,不僅從未“外流”到其他經濟體,反而優勢越來越大。

追趕與模仿並不可鄙,產業的進步從來沒有拔地而起的故事。反倒是不同行業間隱藏的遞進與鏈接,決定着一個經濟體面對技術浪潮時的姿態與命運。

近期,Mistral宣佈與OpenAI的主要投資方微軟達成重要合作,這一消息火速引起了歐盟相關部門的注意,該部門稱合作可能涉及潛在風險,需要就此進行深入調查[7]。與此同時,歐盟也在針對微軟與OpenAI之間的投資進行併購合規方面的審查。

人工智能的全球分工,好像走向了互聯網與消費電子時代發生過的故事:

美國創新,中國模仿,歐洲罰款,印度抓人。

參考資料

[1] Microsoft shifts AI focus off Sam Altman,AXIOS

[2] Top 10 artificial intelligence events in 2023,AI Magazine

[3] Europe should worry less and learn to love AI,Financial Times

[4] LinkedIn

[5] Companiesmarketcap

[6] 2024年歐洲風險與增長潛望,Lazard

[7] Microsoft’s tie-up with French startup Mistral AI is getting antitrust review from EU,Fortune

[8] 深度學習革命,凱德·梅茨

[9] 不是OpenAI也不是Google,這家估值20億美元的小公司成了AI社區的最愛,硅星人

[10] 大模型前瞻研究:解碼MoE架構,Alpha Engineer

[11] ‘It’s just a matter of time’: why AI could help Europe create its own Apple or Google, The Guardian

[12] Artificial intelligence: Europe needs to start dreaming again,Niccolò Bianchini, Lorenzo Ancona

[13] Europe Regulates Its Way to Last Place,WSJ

[14] 2012,改變人類命運的180天,遠川研究所

[15] 2023人工智能行業現狀報告,騰訊研究院

編輯:李墨天

視覺設計:疏睿

責任編輯:李墨天

研究支持:陳彬/王一川