對話北京智源研究院黃鐵軍:人工智能的“電流”產生後,我們往哪裡去?

10年後回憶2023年,人們該怎麼理解ChatGPT出現後的AI涌現?北京智源人工智能研究院院長、北京大學計算機學院教授黃鐵軍很早就有相關思考。“今天大家對AGI(人工通用智能)和強人工智能太輕描淡寫了,絕大多數人沒有認真想這個詞意味着什麼。”黃鐵軍表示。

9月的珠海暖陽下,第一財經記者見到了前往參加博鰲亞洲論壇國際科技與創新論壇第三屆大會的黃鐵軍。業界人士樂於討論大模型商用的當下,黃鐵軍傾向於目光看得更遠,並思考更終極的問題。他大約10年前就想明白AGI會出現,且在約2045年可以做出來。他告訴第一財經記者,AGI是全面超越人類智能、有自我意識的超級智能,並非很多人理解的通用型人工智能。AGI要不要做,是需極其慎重的事。而AI對人類的影響和預備性措施,早就應該考慮。

黃鐵軍的想法代表了一部分學者和業界人士的擔憂。今年3月,生命未來研究所(Future of Life)發佈了一封《暫停大型人工智能研究》的公開信,呼籲所有AI實驗室立即暫停比GPT-4更強大的AI系統的訓練,暫停時間至少6個月。馬斯克、蘋果聯合創始人Steve Wozniak等知名科技人士簽署了公開信。黃鐵軍也簽署了,他認爲“這是一種呼籲,至少提醒大家前面有危險”。

黃鐵軍認爲可能存在的危險包括,AI智力超越人類後的決策權問題,以及面對強大的AI時,人可能出現的“躺平”心態。但黃鐵軍並不反對AI,或者說認爲“不可能攔住人羣不要往前跑”。他認爲,AI水平趕超後或許能解決人類束手無策的複雜問題,比如星際旅行。面對AI,他認爲人們要做的最重要的事情或是適應。

智源研究院在科技部與北京市的指導下成立,定位爲非盈利科研機構,獨立於高校和商業之外,但智源研究院向業界輸出的骨幹,仍助力奠定國內大模型發展的基礎。智源研究院還是國內最早邁上大模型路線的機構,2021年,黃鐵軍在悟道1.0發佈會上稱,AI從“大煉模型”逐步邁向“煉大模型”,“大模型”的中文表達就此誕生。

作爲國內AI最早的推行者之一,站在學界與業界的交界,黃鐵軍的見解有一定代表性。他將大模型比喻成“發電廠”,將大模型提供的智力比喻爲“電”,並認爲全世界可能只需要屈指可數的幾個大模型。

“就像法拉第用一個線圈在磁場中旋轉,AI也能產生‘電流’了。”黃鐵軍如此形容大模型出現後的當下。與第一財經記者的對話中,他還談及大模型如何改變AI公司的商業邏輯、AI產業未來的形態、AI可能抵達的遠方和人類與AI共處的未來。

“全世界可能只需幾個大模型”

第一財經:國內掀起“百模大戰”,這是企業不得不抓住的風口還是應對競爭的被動應對?匆匆入局大模型,您認爲業界是否缺乏某些思考?

黃鐵軍:總的來說是因爲大模型在人工智能、信息系統裡發揮明顯作用,所以各家都會做。長遠看,不需要那麼多大模型,全球可能只需要屈指可數的幾個大模型體系,但這有一個發展過程。就像現在的移動互聯網,主要是iOS和安卓兩個生態,互聯網最初也有很多局域網,發展到一定程度才融合成一個大體系,大模型這種提供智力服務的基礎設施將是網絡化的。今年上半年,國內出現“百模大戰”,現在(新大模型數量)已經回落,長遠看還會收斂,這是商業正常現象。

在以云爲載體的智力時代,要研究的技術還很多,不是某個公司、某個團隊訓練出一個模型這種概念。就像電網用了100多年,還在研究如何改進電力技術,最終呈現出“一度電花多少錢”的結果。將來,AI也將變成“一度智力”花多少錢、背後多少成本的問題,這是一個比技術學科還大的領域,需要大學、非盈利機構參與,從各角度改進。就像法拉第用一個線圈在磁場中旋轉,產生電流。現在AI也產生“電流”了。從法拉第實驗產生電流開始,到今天能隨時用電,中間有太多事情要做。

第一財經:語言大模型興起後,原本細分領域AI公司的工作方式會不會改變?

黃鐵軍:變化很大,以前AI公司是產品思維,訓練一個模型,比如CV(視覺)模型,整合軟硬件賣人臉識別服務。就像PC時代和移動互聯網時代(的商業模式演變),PC時代是賣PC、賣軟件,移動互聯網時代則出現iOS、安卓的App,平臺開始起關鍵作用。不過,目前很多大模型還是持產品思維,(廠商)認爲大模型可以提升業務(效率)。這還是初級階段,不是長期狀態。

歸根結底,大模型能力強意味着很多因素,例如數據儘可能全、儘可能新。而現在做大模型,(廠商)抓一些數據學習後就開始賣,數據少,智力水平不高。大模型要像電廠一樣,採用多種手段發電,讓大家直接用電,而不是靠賣電機給用戶。(大模型)一定是網絡化的運營服務產業形態。

大模型現在好像已經很大了,但即便是1萬億參數,也不過是人腦的1%,況且人腦的參數還比大模型的參數複雜,未來大模型參數量肯定比現在大很多。最新數據也要進入大模型體系,這不是隨便一個創業公司承擔得了的。大模型應該像電力系統,各方做好一端,最後併入電網、供給服務。大模型不同於此前CV等細分領域大模型,最根本是在於它有吸納一切的能力,它作爲載體,能把生產資料和下游用戶連成一個體系。

第一財經:大模型如果變成發電廠一般的存在,是否涉及壟斷問題?您怎麼看“發電廠”和“用電方”的角色分化?如少數廠商做大模型,其他廠商專注應用層。

黃鐵軍:只要集中在少數幾個平臺,壟斷是肯定的。水電氣產業都不是簡單的自由競爭,所以要從價格、政策上約束。把大模型比作發電廠的說法是從智源研究院出來的,如此說是因爲我們不是企業,而是非盈利機構,我們也不可能壟斷大模型。大模型變成“發電廠”有一個演化過程,涉及國家層面、民衆本身的決策,非常複雜,如涉及個人數據進入大模型的情況,數據匯聚將有遠超商業的問題要處理。超這個方向發展(大模型成爲“發電廠”)是從社會效益最大化的角度來說。

第一財經:大模型基礎上的應用層生態,您認爲會是什麼形態?

黃鐵軍:(大模型)有很多用法,將來的應用有賴於全新的產品出現。討論比較多的應用包括個人助理,個人助理未來可能跟今天的微信一樣,每個人都要用,這是巨大的產品機會。是消費者直接購入機器人還是由機器人公司在背後提供服務,各種產業形態將會探索。如具身智能,機器人自動駕駛也會帶來巨大變化,如果汽車智能化比人更強,開車肯定不是今天這個狀態,或許不用買車,由運營商提供服務。

“生物智能從來不是唯一答案”

第一財經:深度神經網絡構建了目前AI領域的核心,但相對而言,深度神經網絡是一個簡單的結構,核心要素是數據、算力、算法,模仿的並非真正複雜的人,它能達到真正的智能嗎?

黃鐵軍:能產生智能、說什麼樣的結構能更好地產生智能、最優的結構是什麼,有一個發展過程。以前(的智能)都是人設計算法、由人主導,現在一個系統能從數據裡把智能“學”出來,而且還“學”出一些意料之外的智能,這是一次革命,但並非說這個方案最優。深度神經網絡或大模型背後的Transformer架構,偉大之處是因爲讓“這件事發生了”,但往後看5年、10年甚至更長時間,一定會改變,改變可能是顛覆性,也可能是完善性。

從基本的合理性來說,深度神經網絡是多層神經網絡。“深度”基本上是對的,但要多深還沒有理論上的證據。人腦神經網絡裡,新皮層每個功能柱有6層,層與層、功能柱和功能柱之間有複雜連接,形成層級結構,這個層級結構可能只有幾級就到理性思維的層面。(深度神經網絡)可能在幾十層內對於人類的智能就夠了,再多或許強於人的智能。深度神經網絡、Transformer都是好的設計,未來結構會越來越好、效率越來越高。

不合理之處是,跟真正的智能相比,現在信號的表達方式距離生物智能都很遠。信息信號的表達以及在神經網絡中的轉換,有太多改進空間。

第一財經:之前學界探索過類腦等其他路徑,現在它們還有多少發展空間?

黃鐵軍:產生智能的結構和機理無窮無盡,但能否認識到是另一回事。一個人突發奇想設計一個完全不同於生物的結構能產生智能,這種可能性是存在的。生物智能從來不是唯一答案。類腦是有一個參照物,可以逼近它,儘管逼近目標很複雜,但這條路的可行性存在。(類腦)路徑當然有必要,因爲它本來就是發現新結構和機理的道路,儘管現在產業投資關注度相對沒那麼高,但作爲研究方向會繼續下去,我相信對人工智能發展也會起作用。

第一財經:深度學習網絡的機制我們還不清楚,類似一個黑箱。隨着AI進化,人類能夠永遠去理解、把控AI運作的方式嗎?

黃鐵軍:比人類低的動物智能,我們可能完全理解,到人的水平,理解和不理解都有可能,比我們更復雜的智能肯定理解不了。就像猴子理解人類社會運行的規則,超出了它們思維的空間。一個智能系統的複雜程度或可能性空間有一定範圍。如果一個智能系統的空間比你大,你還想理解裡面所有機制,是不可能的。

在我們的想象之外,不代表我們做不出這樣的智能系統。有太多的東西是人不明白原理但能做出來的,就像古代發明指南針、滷水點豆腐,那時誰知道有機物和鹽的相互關係?現在AI(即便是)黑盒子,也是一個可運行的盒子。

“人會丟失越來越多傳統工作”

第一財經:很多人擔心,自己的職業會不會被AI替代。針對AI對人類的影響,現在有沒有必要進行預備性的設計?

黃鐵軍:早就應該考慮。AI會代替一些人類不想做的事,但隨着AI對人類智力的替代,人的控制權可能逐漸被侵蝕。現在社會運行靠人的智力。可能一開始人交出的是一些不那麼重要的智力,但真正重要的東西其實都看起來不重要的東西的匯聚。比如一個決策,在公司裡,決策是基於很多人的意見形成,但如果人寫的報告都由AI替代,實際上決策過程已被滲透,人的影響下降了。從這個意義上講,我們確實早就應該想一想,人的智力活動被替代之後的影響。

從經濟發展的角度,對很多職業而言,只要性價比高,AI肯定會被採用,人會丟失越來越多傳統工作。類似的事在歷史上經歷多次,這次的根本性不同在於,人的能力被逼到最後一個階段。以前體力不做可以動腦力,現在腦力也(可能)被替換。但人生來也不是爲了工作吧?如果不需工作也能生活得很好,這也不是壞事。

根本問題在於,人類原本認爲自己是萬物之靈長,當地球上最高智力的物種地位被挑戰(怎麼辦)。從現在開始的一段時間,AI遠沒有人強,但在某些方面比人強,我已有點擔心人類可能“躺平”。如果努力學習20年也未必有人工智能做得好,還要不要努力?如果AI真的超過人類,人(就)不可能超越了,就像猴子永遠不可能超越人類。(AI)對人類信心的打擊已經產生,只是社會效益可能還沒反映出來。

第一財經:科學研究或是中性,但可能導向未知的未來,人們對AI發展既期待又恐懼,您作爲科研工作者是怎麼想的?前段時間,您簽署了《暫停巨型人工智能研究》公開信。

黃鐵軍:沒有恐懼也沒有期待,應該說,你看着它(AI)往前發展,而作爲個體無法改變技術洪流。我們可以思考,比如能不能慢一點。這基本只是一種呼籲,起不了多大作用,但至少也提醒大家前面有危險。不可能攔住人羣不要往前跑,這不是我們能決定的,人類社會很多方向的發展都是這樣。

2015年,我寫文章提到,30年左右,AGI就會實現。我說強人工智能、超級人工智能會出現,當時很多人不屑一顧,實際上我的意思是製造智能可以在30年左右做出來,理解可能得更長時間,甚至永遠理解不了。如果它(超越人類智力的AI)做出來了,控制者不是人了,你能做的就是做一定的適應。適應過程可能有衝突,也可能平滑過渡。人類如果不那麼(堅持)認爲自己是天下的主人,(到時)也過上衣食無憂的生活,至少這是一個選項。

智能本來就在演化,怎麼能永遠停留在人類現在的水平上?生物進化速度有點慢,現在換了一個載體(AI),進化加速了,可能人類永遠解決不了的問題,在新的智能時代得到解決。比如,人類還沒走出地球這個舒適圈,新的智能體有可能解決星際旅行問題。現在我們好像在一個安全的搖籃裡生活,實際上對宇宙中很多危險沒有解決方案。科學家針對複雜的問題還在努力,但或許找不到辦法,如果這時更強的智能系統找到辦法,我們就往前跨一大步。