AI和量子:誰將主宰未來計算?

來源:Stephanie Arnett/MIT Technology Review | Getty

科技公司多年來向量子計算機投入了數十億美元,希望它們能在金融、藥物研發和物流等多元化領域帶來顛覆性變革。

在物理和化學領域,這種期望尤爲強烈,因爲量子力學的奇異效應在其中起着關鍵作用。從理論上講,這是量子計算機相較傳統計算機擁有巨大優勢的領域。

然而,當量子硬件面臨複雜技術難題而步履維艱時,另一個挑戰者正在這些最具潛力的應用領域取得突破。人工智能(AI)如今被應用於基礎物理、化學和材料科學,這種趨勢表明量子計算被認爲的“主場優勢”或許並不牢固。

瑞士聯邦理工學院(EPFL)計算物理學教授 Giuseppe Carleo 表示,AI 模擬量子系統的規模和複雜性正在迅速提高。上個月,他與人合作在Science上發表了一篇論文,指出基於神經網絡的方法正迅速成爲模擬具有強量子屬性材料的領先技術。Meta 公司最近也發佈了一個 AI 模型,該模型基於一個大規模材料新數據集進行訓練,在材料發現的機器學習排行榜中躍居榜首。

鑑於近年來的快速進展,越來越多的研究人員開始思考:在大規模量子計算機真正問世之前,AI 是否已經能夠解決化學和材料科學中大部分最有趣的問題。

“這些機器學習新技術的出現對量子計算機潛在應用構成了嚴重打擊,”Carleo 說,“在我看來,這些公司遲早會發現,他們的投資並不合理。”

量子計算機的潛力在於其能夠比傳統計算機更快地完成某些計算。然而,要實現這一潛力,需要比現有規模更大的量子處理器。目前最先進的設備剛剛突破 1000 量子比特,但要達到對經典計算機的壓倒性優勢,可能需要數萬甚至數百萬量子比特。一旦這種硬件得以實現,一些量子算法,例如破解加密的 Shor 算法,將能夠以指數級的速度解決問題,這遠非經典算法可以企及。

然而,在許多具有明顯商業應用的量子算法中,例如數據庫搜索、優化問題求解或驅動人工智能,其速度優勢相對較小。去年,微軟量子計算負責人 Matthias Troyer 聯合發表的一篇論文表明,當考慮到量子硬件運行速度比現代計算機芯片慢幾個數量級時,這些理論上的速度優勢可能會消失。此外,將大量經典數據輸入和輸出量子計算機的難度也是一個主要障礙。

因此,Troyer 及其同事得出結論,量子計算機應更多地關注化學和材料科學中的問題,這些問題需要對量子效應占主導地位的系統進行模擬。從理論上講,基於這些系統的量子原理運行的計算機在這裡應該具有天然優勢。事實上,自著名物理學家理查德·費曼首次提出這一概念以來,這一直是量子計算的核心推動力之一。

量子力學規則主導着許多具有巨大實際和商業價值的事物,例如蛋白質、藥物和材料。它們的性質由其組成粒子之間的相互作用決定,尤其是電子之間的相互作用。在計算機中模擬這些相互作用,應該能夠預測分子會表現出何種特性。例如,這對發現新藥物或開發更高效的電池化學具有巨大的價值。

然而,量子力學那些令人費解的規則——特別是使遙遠粒子的量子態可以本質上相互關聯的糾纏現象——會使這些相互作用變得極其複雜。精確追蹤這些相互作用需要極其複雜的數學運算,而當粒子數量增加時,運算的難度會呈指數級增長。這使得在經典計算機上模擬大型量子系統幾乎變得不可行。

這正是量子計算機大展拳腳的地方。由於量子計算機同樣基於量子原理運行,它們能夠比經典計算機更高效地表示量子態,同時可以利用量子效應加速計算。

然而,並非所有量子系統都是相同的。其複雜性取決於粒子之間的相互作用或關聯程度。在相互作用強的系統中,追蹤所有這些關係所需的計算量可能會迅速增加。而對於化學家和材料科學家感興趣的大多數系統,關聯通常較弱。Giuseppe Carleo 指出,這意味着這些系統中的粒子對彼此行爲的影響不顯著,從而使得這些系統更容易被建模。

Carleo 總結道,對於化學和材料科學中的大多數問題,量子計算機可能不會提供任何優勢。經典工具已經能夠精確建模弱關聯繫統,其中最爲顯著的是密度泛函理論(DFT)。DFT 的核心思想是,只需瞭解系統的電子密度(即電子在空間中的分佈),就可以理解其關鍵特性。這種方法大大簡化了計算,同時仍能爲弱關聯繫統提供準確結果。

使用這些方法模擬大型系統需要相當大的計算能力。然而,近年來,基於 DFT 的研究激增,生成了大量化學、生物分子和材料數據,這些數據可用於訓練神經網絡。AI 模型通過學習這些數據中的模式,可以預測特定化學結構可能具有的特性,而其運行成本比傳統的 DFT 計算低幾個數量級。

這種方法大幅擴展了可模擬系統的規模——一次可以模擬多達 10 萬個原子——以及模擬運行的時間範圍。盧森堡大學物理學教授 Alexandre Tkatchenko 表示:“這簡直太棒了。你幾乎可以完成大多數化學問題。”

卡內基梅隆大學化學教授 Olexandr Isayev 也表示,這些技術已經被廣泛應用於化學和生命科學領域的公司。而對於研究人員而言,此前無法觸及的問題,例如優化化學反應、開發新型電池材料和理解蛋白質結合等,如今都變得可行。

“與大多數 AI 應用一樣,數據是最大的瓶頸。”Isayev 指出。Meta 最近發佈的材料數據集包含對 1.18 億種分子的 DFT 計算結果。用這些數據訓練的模型實現了最先進的性能,但生成這些訓練材料耗費了龐大的計算資源,遠超大多數研究團隊的能力。這意味着要完全實現這一方法的潛力,需要鉅額投資。

然而,用 DFT 模擬弱關聯繫統並不是一個指數級增長的問題。這表明,只要擁有更多數據和計算資源,基於 AI 的經典方法甚至可以模擬這些系統中最大的部分。Tkatchenko 補充道,考慮到能與之競爭的量子計算機可能仍需數十年時間,AI 當前的發展軌跡表明,它或許能更早實現一些重要的里程碑,例如精確模擬藥物與蛋白質的結合過程。

強關聯繫統

在模擬強關聯量子系統時(即粒子之間相互作用較強的系統),像 DFT 這樣的傳統方法很快就會失去效用。這類系統雖然更加複雜,但包括了一些具有潛在變革能力的材料,例如高溫超導體或超精密傳感器。然而,即便在這一領域,人工智能也正在取得顯著進展。

2017 年,瑞士聯邦理工學院(EPFL)的 Giuseppe Carleo 與微軟的 Matthias Troyer在Science上發表了一篇開創性論文,展示了神經網絡可以用於模擬強關聯量子系統。這種方法並不像傳統意義上的機器學習那樣從數據中學習。相反,Carleo 解釋,這種方法與 DeepMind 的 AlphaZero 模型類似。AlphaZero 通過掌握圍棋、國際象棋和將棋的規則並進行自我對弈實現了卓越的表現。

在量子系統的模擬中,“遊戲規則”由薛定諤方程提供,它可以精確描述系統的量子態或波函數。模型通過將粒子排列成某種配置,並測量系統的能量水平來進行“對弈”。目標是找到最低能量配置(即基態),這是系統性質的決定因素。模型不斷重複這一過程,直到能量水平不再下降,表明已經接近或達到基態。

這些模型的強大之處在於它們能夠壓縮信息。Carleo 表示:“波函數是一個非常複雜的數學對象。現在,多個研究已經表明,神經網絡可以以經典計算機能夠處理的方式捕捉這一對象的複雜性。”

自 2017 年那篇論文以來,這種方法已經擴展到更廣泛的強關聯繫統。Carleo 指出,結果令人印象深刻。他與同事上個月在Science上發表的論文中,將這一方法應用於多種複雜的量子模擬問題,並對當前領先的經典模擬技術進行了測試,旨在爲經典方法和量子方法的進展提供基準。

這些研究表明,神經網絡不僅能夠有效模擬強關聯繫統,還在處理這些複雜問題方面樹立了新的技術標準。這種能力讓 AI 在模擬最棘手的量子系統方面展現出極大的潛力。

Carleo 表示,基於神經網絡的技術現已成爲模擬他們測試的許多最複雜量子系統的最佳方法。“機器學習在這些問題中確實佔據了領先地位,”他說。

這些技術吸引了科技行業一些大玩家的注意。今年 8 月,DeepMind 的研究人員在Science上發表論文,展示了他們能夠精確模擬量子系統中的激發態,這一能力未來可能用於預測太陽能電池、傳感器和激光器的行爲。微軟研究團隊也開發了一套開源軟件套件,幫助更多研究人員利用神經網絡進行模擬。

法國 École Polytechnique 的人工智能與凝聚態物理學教授 Filippo Vicentini(也是Science基準測試論文的合著者)表示,這種方法的一個主要優勢在於,它可以利用人工智能軟件和硬件領域的巨大投資。“能夠利用這些技術進步爲我們提供了巨大的優勢,”他說。

需要注意的是,由於基態是通過試錯而非明確計算獲得的,這些方法提供的只是近似解。然而,正因如此,這一方法在看似無法解決的問題上取得了進展。ETH Zurich 研究員 Juan Carrasquilla(也是Science基準測試論文的合著者)指出,如果目標是準確追蹤強關聯繫統中的所有相互作用,隨着系統規模的擴大,所需的計算量將呈指數級增長。但如果僅需要一個“足夠好”的答案,那麼利用一些捷徑就有很大餘地。

“或許要精確模擬它是不可能的,”Carrasquilla 說,“但我們可以捕捉足夠多的信息,涵蓋物理學家關心的所有方面。如果我們做到了這一點,它實際上與真實解幾乎沒有區別。”

儘管大多數強關聯繫統對經典方法來說過於複雜,但某些系統卻不在此列。例如,根據 2023 年發表在Nature Communications上的一篇論文,有些系統對於高溫超導體的建模是相關的,而經典方法可以勝任。

微軟研究團隊的負責人 Frank Noe 指出,“由於指數複雜性,你總會找到一些問題,無法找到捷徑。”但他補充道,“我認爲,無法找到良好捷徑的系統數量將變得越來越少。”

沒有萬能的解決方案

渥太華大學物理學助理教授 Stefanie Czischek 表示,目前尚難預測神經網絡究竟可以解決哪些問題。在某些複雜系統中,神經網絡表現出色,但在看似簡單的系統中,其計算成本卻可能意外飆升。她指出:“我們並不真正瞭解它們的侷限性。沒有人確切知道哪些條件會讓這些神經網絡難以表示系統。”

與此同時,其他經典量子模擬技術也取得了重要進展。紐約 Flatiron Institute 計算量子物理中心主任 Antoine Georges(也是Science基準測試論文的合著者)表示:“每種方法都有其成功之處,而且它們相輔相成。因此,我不認爲這些機器學習方法會完全取代其他方法。”

IonQ 量子解決方案高級總監 Martin Roetteler 認爲,量子計算機也會找到自己的優勢領域。他同意經典方法可能足以應對弱關聯繫統的模擬,但堅信某些大型強關聯繫統會超出經典方法的能力範圍。“指數級複雜性最終會成爲障礙,”他說,“對於某些強關聯繫統,我們無法用經典方法解決。我對此深信不疑。”

相比之下,他認爲未來具備容錯能力、量子比特數量遠超現有設備的量子計算機將能夠模擬這些系統。這可能幫助發現新型催化劑,或提高對人體代謝過程的理解——這是製藥行業的關鍵領域。

未來的計算格局:混合模型

IBM 量子計算項目負責人 Jay Gambetta 認爲,神經網絡可能會擴展能夠解決的問題範圍,但他並不認爲它們能解決企業最關心的最難問題。“這就是爲什麼許多以化學爲核心需求的公司仍在研究量子計算,因爲它們非常清楚這些近似方法的侷限性。”

Gambetta 還否認了這些技術是競爭關係的觀點。他認爲,未來的計算很可能採用一種混合模式,將量子和經典子程序結合起來解決問題。“我不認爲它們在競爭。我認爲它們實際上是互補的,”他說。

但德克薩斯大學量子信息中心主任 Scott Aaronson 指出,在量子化學和凝聚態物理等領域,機器學習方法確實直接與量子計算機競爭。他預測,機器學習和量子模擬的結合將在許多情況下優於純粹的經典方法,但這一點可能需要等到更大規模、更可靠的量子計算機出現後纔會明確。

“從一開始,我就將量子計算視爲首先是一個科學探索,而任何工業應用只是錦上添花,”Aaronson 說,“因此,如果量子模擬僅偶爾超過經典機器學習,我不會像某些同事那樣感到特別失望。”

EPFL 的 Carleo 指出,量子計算機很可能在模擬複雜量子系統如何隨時間演化方面具有明顯優勢。這可能爲統計力學和高能物理等領域的科學家提供寶貴的洞察,但在短期內似乎不太可能帶來實際應用。他補充道:“這些更多是利基應用,在我看來,並不足以證明鉅額投資和巨大的炒作是合理的。”

儘管如此,MIT Technology Review採訪的專家表示,缺乏商業應用並不是停止追求量子計算的理由,它在長期內可能帶來基礎科學的突破。

“科學就像一組嵌套的盒子——你解決了一個問題,卻發現了另外五個問題,”Filippo Vicentini 總結道,“我們研究的事物複雜性會隨着時間的推移不斷增加,因此我們始終需要更強大的工具。”

https://www.technologyreview.com/2024/11/07/1106730/why-ai-could-eat-quantum-computings-lunch/