古典互聯網創業者的“第二春”:讓大模型先跑一會兒

©商業與生活 文|朱曉培

校對|大道格

“今天真正是一個在技術領域,對未來10年、20年形成重大歷史契機的關頭。”

4月11日,阿里巴巴集團董事會主席兼CEO、阿里雲智能集團CEO張勇現身2023阿里雲峰會現場。這是他躬身入局進入到雲的戰場後的第一次公開演講,也是疫情開放以來的中國互聯網的第一此大型活動。

活動現場摩肩接踵,主論壇坐滿了,直播間坐滿,工作間也滿了,擠不進去的人們就圍在走廊的大屏前觀看直播。而同樣熱鬧的現象,也出現在了一週之後的火山引擎的原動力大會現場。

人們風塵僕僕的從四面八方趕到現場,都在關心同樣的問題:如何重回增長?如何看待正如火如荼的人工智能(AI)浪潮?

過去兩個多月,因爲ChatGPT的走紅,中國互聯網科技領域一改近兩年沉悶的氛圍。從已經久居幕後的互聯網連續創業者,到互聯網大廠,各個摩拳擦掌,都期望在AI浪潮中尋得一席之地。

看起來,以大模型技術爲代表,新技術帶來的效率革新就在眼前。在這樣一個風雲變幻大時代場景下,所有的人都熱切的想知道,這個AI浪潮,對中國的經濟,乃至對中國科技的未會帶來什麼?

01

大模型大爆發

自2月10日,王慧文發佈自己的AI宣言以來,在中國創投界一向雷聲大、雨點小的AI領域,突然如老房子着火,一發不可收拾。

據不完全統計,僅過去一個月內,國內已經或者即將內測的大模型就有百度文心一言、阿里通義千問、華爲盤古、騰訊混元、崑崙萬維天工、商湯日日新SenseNova、AI創業公司Minimax、360大語言模型、出門問問序列猴子等等。此外,火山引擎發佈了大模型訓練雲平臺。小米雷軍也按耐不住在微博上表示,對於大模型,將“全力以赴,堅決擁抱,正在研發一些有趣的技術和產品”。

這輪由ChatGPT引爆的技術熱潮,經過了三個多月的發酵,就在國內迎來了第一輪爆發。密集的發佈會,讓從業多年的老媒體人也感慨,職業生涯少見。

出門問問CEO李志飛說,自己在去年12月就開始了大模型的開發,總覺得自己應該是國內第一個發佈大模型的,但沒想到百度的文心一言、阿里的通義千問等都搶在了前面。

隨着互聯網大廠紛紛躬身入局,形式似乎也越來越明朗——ChatGPT 開啓了通用人工智能(AGI)時代,而大模型是目前看來通往 AGI 最靠譜的實現方式。

“ChatGPT 給了我非常強的震撼,它特別有意思的是,無論你如何‘調戲’,它都能給你答案。”李志飛說,之前,他對AI大模型持懷疑態度,想不通可以用來做什麼;但GPT-3 發佈後,他覺得AI什麼都可以做了。

“人工智能技術全面的爆發,和新一代技術的出現,和可能帶來的對各行各業顛覆性的影響,和時代的機會,讓我們看到了一個全新的數字化時代後智能化時代的到來。”阿里張勇認爲,所有行業、所有應用、所有軟件、所有服務都值得基於新型人工智能技術、基於AIGC各方面技術支撐、大模型支撐重做一遍。“這一定能帶來不僅是一種創新性的客戶體驗、客戶服務滿足,同時也會讓我們的生產範式、工作範式、生活範式發生很多變化。”釘釘總裁葉軍也率先表示,“用大模型重做一遍釘釘,我們的決心是非常大的。

李志飛也持相似的態度,“AGI一定會對這個時代產生重要影響,未來五年,我看不到任何一個行業不會被大模型影響。無論是什麼行業,包括物流、供應鏈、硬件等各種看起來和大模型沒有直接關係的行業,都將受到影響”。

02

古典互聯網創業者重新紮堆

“因爲GPT,一批古典互聯網創業者又重新紮堆了。”一位資深媒體人、創業者在加入了一個AI創業羣后,發現羣裡大部分人都是老朋友——都是一些連續創業者,有人還做過一兩家上市公司,但前兩年又處於退休的狀態,比如王慧文、王小川。

既然連張勇都認爲,在大模型面前,大家都在同一起跑線上,那麼古典互聯網創業者的激動,也就在情理之中。

弗洛伊德曾提出過一個名詞——“窮人精神官能症”,指經濟快速發展的過程中,除了少數幾個“贏家”外,還有一羣人(仍是少數)雖然經濟狀況已經在普通人之上,但卻對現狀既不滿意,一遍覺得自己賺得還不夠,另一邊有喜歡對外說自己對錢沒興趣。這種“症狀”其實同樣適用於創投領域,特別是小有成績的創業者,更渴望巨大的成功。

“你遇到超越工業革命的這麼一件事兒,肯定會去思考,要做點什麼?”正如寶寶樹創始人王懷南所說。他對《商業與生活》表示,無論是寶寶樹這一端,還是在銀髮事業這一端,大模型的出現,讓自己都有巨大的機會可以革自己的命。眼下,他也正在籌備自己相關的創業項目。

但最激動、最積極的,莫過於搜狗公司創始人王小川。雖然他比王慧文晚了兩個月才宣佈進入大模型領域創業,但一入場就接二連三的接受了多家媒體的採訪。

據王小川自己爆料,他新創辦的百川智能,以前搜狗團隊爲基礎,還拉攏了百度、華爲、微軟、字節、騰訊等知公司以及其他創業公司核心成員在內的數十位頂尖AI人才。而公司目標,也在王慧文“組建中國版OpenAI”的基礎上,又增加了“打造顛覆性上層應用”。

王小川在接受媒體採訪難掩興奮,他說,“通用人工智能時代剛剛開啓,我們作爲第一批跨入新時代的人類,帶着焦慮和好奇去擁抱它,思考和探索‘我是誰?’我們還可以把自己的智慧注入它,做新時代的開創者,讓後代們有一個更美好的未來,繁榮和延續人類文明。”

不過,他可能忘了,一年半前,他曾在宣佈卸任搜狗CEO的內部郵件裡宣佈,往後二十年,要在生命科學和醫學領域再出發,爲大衆健康做貢獻。畢竟,大健康這個領域的風口,隨着疫情的結束已經落了下去。

當然,連續創業者成爲爲大模型搖旗吶喊的主力,還有一個原因,大模型燒錢。根據國盛證券報告《ChatGPT 需要多少算力》估算,GPT-3 訓練一次的成本約爲140萬美元,對於一些更大的 LLM(大型語言模型),訓練成本介於200萬美元至1200萬美元之間。李志飛也表示,“目前ChatGPT訓練一次的成本就高達1千萬美元,‘算力’也就是芯片的開銷,就是一筆鉅額成本。”

此前,王慧文豪拋出5000萬美元招募大模型人才時,還被外海通證券研究所科技產業鏈負責人鄭宏達質疑“5000萬美元夠幹什麼的?”因此,這也不是像以往的電商、社交甚至O2O項目那樣,是普通打工人就可以想的事情。但對於那些手握大量現金,又處於隱退狀態的連續創業者而言,這確實一個難得的好機會。

王慧文說,自己本來想搞個基金,去投最前沿的科研。因爲前沿科技的投資,打水漂的比例很高,名字都想到好了,就叫傻瓜資本。但是,還有句話說,投資別人,不如投自己。

03

做大還是做小

從技術的角度來看,大模型發端於自然語言處理領域,以谷歌的BERT、OpenAI 的GPT 爲代表。這兩個大模型越跑越大,目前參數規模逐步提升至萬億,隨着用於訓練的數據量級也顯著提升,模型能力的提高。

但其高深莫測的AI能力,也引發了業界的擔憂。

此前,包括馬斯克、圖靈獎得主Yoshua Bengio、蘋果聯合創始人Steve Wozniak等多位科技界知名人物簽署了一封公開信,呼籲在6個月內暫停開發比OpenAI公司新推出的GPT-4更爲強大的系統。

公開信被曝光後,引發了更多的人開始關注、反思AI背後的安全性問題。目前,歐洲多個國家已經掀起了對ChatGPT的監管行動。而ChatGPT也從人工智能的寵兒,開始變成需要“鎖在籠子裡的巨獸”。

身處風暴中的OpenAI公司CEO山姆·阿爾特曼(Sam Altman),在近日的麻省理工學院的公開活動上,對公開信做出迴應稱:“我非常同意其中的部分內容。我們完成對GPT-4的訓練後,花了6個多月的時間,研究大模型的安全性……我也同意,隨着AI能力變得越來越強大,安全標準必須提高。”“現在並未訓練GPT-5,在短期內也不會訓練。”

與OpenAI一開的策略不同,國內大模型普遍選擇從B端起步。從目前的信息可以看到,企業都在思索如何將已有的大模型規模 “做小”,以更小的參數,做更有效率、更適合垂類的場景。

比如,華爲盤古大模型,就將重點發展細分場景的落地爲煤礦、水泥、電力、金融、農業等。

阿里通義千問目前也已改造阿里生態內的產品爲主。而百度對文心一言的定位也同樣偏向B端,主打爲金融、能源、媒體、政務、醫療等行業賦能。

把大模型做“小”,有幾個好處。

首先,技術上,GPT-4已經接近了LLM(大語言模型)的極限。山姆·阿爾特曼說,“我認爲,我們已經走到了這個時代的盡頭,我們將以其他方式把這些大模型做得更好。”“如果可以的話,參數數量應該隨着時間的推移而減少,或者我們應該讓多個模型一起工作,每個模型都更小。我們希望向世界提供的是最強大、最實用、最安全的模型。”

其次,是省錢。衆所周知,大模型參數越大,訓練花費越高。使用的人越多,耗費的算力越高。在商業化模式還不明朗、開源節流仍是時代主題的當下,一昧的做大,讓大模型成爲人們“調戲”的對象,在商業和技術上並沒有太大的意義。

04

挖礦或者賣鏟子

當別人都去挖金礦的時候,穩賺不賠的一定是賣鏟子的人。要做大模型,則離不開算力這個“鏟子”。

根據國盛證券的報告,以 ChatGPT 在1月的獨立訪客平均數1300萬計算,其對應芯片需求爲3萬多片英偉達A100 GPU,初始投入成本約爲8億美元,每日電費在5萬美元左右。如果將當前的ChatGPT部署到谷歌進行的每次搜索中,需要512820.51臺A100 HGX服務器和總共4102568個A100 GPU,這些服務器和網絡的總成本僅資本支出就超過1000億美元。

大模型訓練非一日之功,想要入局大模型,擁有大算力是必備條件之一。市場上流傳的調研紀要顯示,要訓練像ChatGPT這樣的生成式AI,至少需要1萬張英偉達A100加速卡的支持。目前,國內只有6家公司具備這樣的硬件實力。更不要提後續,隨着模型擴張、場景落地,算力需求還會進一步增加。

換個角度而言,不論大模型未來走向何方,“算力”都將會是受益的那方。因此,騰訊、阿里以及字節,這些本身就擁有云服務的企業,一邊加自研大模型,一邊開始搶奪算力市場。

4月14日,騰訊雲發佈了面向包括自動駕駛訓練、自然語言處理、AIGC大模型訓練等大模型訓練的新一代HCC(High-Performance Computing Cluster)高性能計算集羣。

火山引擎總裁譚待則表示,火山引擎將全面基於DPU構造大規模算力中心,形成DPU+CPU+GPU的混合算力體系。並強調,“除了自研能力帶來的極致性能以外,通過規模化優勢爲客戶帶來更多“實惠”也是火山引擎一直努力的方向。“

“(阿里雲對)智能化時代的到來已經準備好。”張勇說,雲計算、人工智能爆發的發展,首先需要一個幾何級速增加的算力支撐。而阿里雲經過這麼多年的建設形成了全棧的技術服務,未來工作的一個重要方向就是“算力普惠”。

張勇讓阿里雲的同事把過去10年雲計算服務最重要的兩個價格,發現算力服務降了80%,存儲服務降幅則接近90%。但未來,他希望中間算力的成本能達到今天的1/10,乃至1/100。

巨頭大力佈局算力市場,看起來也是一個雙贏的局面。

具體來說AGI需要靠給用戶提供有價值的服務來商業化,並且利用用戶對服務的反饋來持續的提升,我們堅持做AGI原生應用,這些應用本身就是“User--in-the-Loop”的系統。過去的幾個月裡,這個系統平均每天與用戶產生近億次的互動,並在互動中持續提供更好的服務體驗。

“對於一家創業公司來說,我們無法在一開始就擁有大量的算力,但是我們非常幸運的發現,中國的公有云市場已經積累了,大量的算力和經過驗證的基礎設施。”MiniMax聯合創始人楊斌說。MiniMax是依託火山引擎機器學習平臺,研發的超大規模的大模型訓練平臺。

楊斌感慨,一年多前,作爲一家AGI初創公司說要研發大模型,幾乎是天方夜譚。但今天,隨着GPT熱潮涌動,技術如何啓動,產品怎麼做,算力從哪裡來?這三個問題都不再是大問題了。

05

誰是中國的OpenAI?不重要!

目前,業內普遍認爲,國內的大模型與OpenAI仍有差距。

李彥宏說,“如果全面來評測的話,文心一言確實也不如現在最好的 ChatGPT 版本,但是差距不是很大。所謂不是很大,可能就是一兩個月的差別。”

王小川在接受媒體採訪時則表示,差距極大,在生成式人工智能領域美國“比我們領先3年時間是有的”。

李志飛則給了一個折中的數據,“國內模型水平大概處於FLAN階段,比GPT4晚16個月。”

因爲,差距到底有多大,王小川與百度還暗戳戳的互懟了起來。而互懟的背後,則是都想宣稱自己是中國的OpenAI。

王小川在接受媒體採訪時說,年底要做出國內最好的大模型,對標GPT-3.5的大模型。但百度集團副總裁、搜索平臺負責人肖陽暗示:王小川脫離一線太久,對國內人工智能技術的發展缺乏瞭解。“我們當然非常希望中國如果能夠跑出一家像OpenAI一樣的公司。但是怎麼說呢,當年搜狗也立志取代百度,結果也是顯而易見。”

但實際上,現在誰是中國的OpenAI這件事,正在變得不重要。就像張勇所說的,“不管誰做了大模型,不管誰做了什麼樣的模型,不管誰做了專屬模型,今天我們暢想未來,10年以後、20年以後回過頭來看這段時間,其實我們所有的企業都在同一個起跑線上。”

而且,隨着越來越多的公司發佈自己的大模型,並找到相應的行業切入。越來越多的業內人士開相信,未來將會是多種模型共存的局面。阿里也表示,通義千問是爲用戶提供了更多一種的選擇,“我們也希望在阿里雲的平臺,在雲的基礎設施平臺上,不僅有阿里的通義大模型,同時也有跟高校、科研院所、各行各業合作的基礎大模型。”

“就像多雲是既成事實一樣,多模型也一定會是未來趨勢,多雲多模型是長期的IT格局。”火山引擎譚待說。

即使是最先提出要做中國的OpenAI的王慧文,再鍵入AGI領域兩個月後,也有了不一樣的認知。“這個事情還是有非常多要探索的東西。不到最後一天,AGI這個事情誰做成還不好說,你憑什麼認爲一定是OpenAI先於我們做成?它們只是現在領先而已。”

06

讓大模型再跑一會兒

回看王慧文2月的AI宣言,就像在乾草堆裡點了一把火,讓中過的互聯網公司熱鬧了起來。這裡面,固然有蹭熱度、趕潮流的,但對於雲計算來說,其實也是厚積薄發、水到渠成的結果。

儘管有一些人質疑GPT又會是一場技術泡沫。比如吳軍就撰文稱,ChatGPT被過度的炒作了,“不算新技術革命,帶不來什麼新機會 ”

但是,技術泡沫也有泡沫的好處。財經作家邁克爾·劉易斯在《爲經濟繁榮辯護》一文中提到一個觀點:每一次技術泡沫,都會讓社會受益。

無論你對繁榮有什麼看法,不可否認的是,它會讓人們不停地忙碌。資金會以工資的形式流向社會,更多的年輕人會因此受到技術訓練,並擁有了創業慾望;企業家會產生更多有趣的商業想法,這些想法或許看起來是超前的,但說不定有一天就與時代保持一致了。哪怕競爭看起來是一地雞毛,就像第一次互聯網泡沫破後數百萬英里長的冗餘光纖,當時看起來有點兒浪費,但今天又在人們生活中扮演着重要的角色。

我問王慧文,“各種大模型的密集的出貨速度,有沒有出乎你的意料?”他答道,“還好吧。”

不同於之前做美團,看誰都是對手,忍不住想刻薄兩句。王慧文說,看AI領域的從業者,勇於踏上這條路的人都是勇士,需要的是同舟共濟。而張勇也說,如何抓住未來的機會,是大家共同的願望,也需要一些共同的合作和努力。

更何況,科學技術的發展,不是積累式的線性的,而是跳躍式的,一經突破將迅速展開,就會另闢蹊徑進入一個新的世界。因此,不妨讓大模型先跑一會兒。

—End—

更多關注:商業與生活,ID:xiaopeizhu8

內容同步:本站號、同花順、百家號、今日頭條、UC、雪球、企鵝號、一點資訊、知乎、搜狐等。