對話谷歌大神Jeff Dean:實現通用AI需要5到500年

本文系本站智能工作室(公衆號 smartman163)出品,此篇爲AI英雄人物專訪第42期。

選自|Gigaom

翻譯|本站見外翻譯機器

審校|秦昕

傑夫·迪恩(Jeff Dean)是美國工程院院士、ACM Fellow、Google高級研究員,屬於谷歌最早的僱員之一,他1996年從華盛頓大學計算機係獲得博士學位,1999年加入谷歌,他成爲谷歌成長過程的關鍵人物,谷歌分佈式計算基礎構架主要由他設計和完成,該構架支持了谷歌的大部分產品,他還被稱爲“谷歌大腦背後的大腦”。

一、關於“Google Brain”項目

【問】我記得你開始在谷歌工作可以追溯到上個世紀了,對嗎?

【Jeff Dean】是的,是在1999年。當時公司成立還不到一年,公司非常小,所有員工都擠在帕洛阿爾託市中心的二樓辦公室,樓上是一家T-Mobile商店。

【問】感覺就像一家初創公司一樣。那當時的環境是怎樣的?

【Jeff Dean】我記得我們有一張乒乓球桌,隨後變成了兩張因爲我們要在上面吃午餐。但是當時我們正在努力開發一款索引擎,所以每天還都是興奮充滿活力的,在這個領域有很多令人激動的工作。

【問】在過去的十七年裡,你所做過的各種工作是不是可以列出一張驚人的清單了?

【Jeff Dean】當然可以。我做的第一件事是把我們廣告系統的初始骨架整合在一起,我花了一段時間來研究它。接下來的四五年中,我大部分時間都在和其他人合作,致力於開發我們的核心搜索系統引擎。這就是所謂的“呼叫系統”——把所有我們可以蒐集到的網頁整合到一個索引中來,然後把它變成一個可以在用戶提問時快速作出迴應的系統。

用戶在谷歌中鍵入一些東西,隨後我們希望系統能夠快速分析出哪些頁面與該查詢相關聯,隨即給出結果。 當一個查詢問題輸入到谷歌時,服務系統決定如何在許多計算機上分配這個請求並進行結果查詢,最後將它們各自的分析結果整合到一個可以反饋給用戶的系統中來。我從事相當長一段時間的核心搜索和索引工作。

【問】現在你帶領着谷歌大腦“Google Brain”項目。那麼,這個項目究竟是做什麼的呢?

【Jeff Dean】沒錯。主要來說,我們在大量的進行機器學習和人工智能方面的研究,然後利用我們的研究成果來製造智能系統。如果一個智能系統在一種產品中使用,那麼通常情況下可能會帶動新產品的產生。

當我們致力於將產品整合到現有產品中時,通常會和其他谷歌產品團隊緊密合作,一同將我們的研究成果轉化爲產品。除此之外,我們還單純地做大量的調查,去發現我們存在能力去開發的一些現在可能不被重視,但是未來卻十分有價值的前沿系統。

【問】每個人對“人工智能”都有不同的見解,那麼你是怎樣理解的呢?什麼是人工智能? 你能用幾句簡單的話術來定義它?

【Jeff Dean】這是自計算機誕生以來就一直存在的一個術語。對我來說,這意味着要打造一種看起來很智能的東西。它是區分人類和其他生物的方式之一,我們擁有更高級的智慧。除此之外,我們可以交流,我們可以獲取有益的信息,並能在很高的層次上理解它們。

當我們去做一件事的時候,每個人都有不同的做法。所以我們想要建立一個可以最大程度體現智慧層面的系統。有時候所需的智慧是狹義的,比如我們希望他們能夠完成一項我們認爲很重要的任務,並具有狹義智能。

但是,與此同時我們也希望建立一個可以做很多不同的事情的智能系統。我認爲,目前在某些領域,狹義智能工作表現得相當不錯。廣泛的、真正靈活的智能目前顯然還是一個開放的研究話題,可能需要人們投入一定的時間對它們進行長期研究——實際上問題的關鍵是找出如何建立能夠在多數情況下都能作出反應的智能系統。

【問】你提到“舉止聰明”和“顯得聰明”。比如人造草皮,並不是真正的草皮,一些系統也並不是真正的智能,而是在模擬智能。這個說法你同意嗎?

【Jeff Dean】提到某些模擬智能,我的意思是,它展示出了一些真正智能系統會有的相同特徵。但是實際上它可能會用一種不同的方式做事情。比如,生物和硅有着不同的優點和缺點,但是儘管如此你最終關心的是這個系統或媒介是否能以一種有用的方式運作,從而增強人類智力。

二、通用人工智能會成爲一種可能

【問】你提到了AGI,通用人工智能。能夠實現這種智能的時間大概需要5到500年。那麼,你是怎麼看待如此大的時長差異呢?

【Jeff Dean】我認爲這是一個很大的時間範圍,是因爲我們正在做的事情有很多是很清楚人不確定性。我們並不類是如何處理得到的各種信息,並對此制定之後的策略的。我們對此僅有一點了解,但沒有深入的去研究過,因此這意味着我們無法確定想要完成一個智能系統所需要的時間。

這就導致了各種各樣的時間估計偏差。我有點介於兩者之間。我認爲在過去的五到十年裡,我們已經取得了很大的進步,在這之前的二十年或三十年裡,我們已經取得了進步。我們的系統將會有非常廣泛的智能功能,也許在未來的二十到三十年,但是我在這個估計上可能有很高的誤差。

【問】通過你剛纔的描述,感覺通用人工智能是我們之前工作的進化,而不是一項完全不同的事物。實際上,我們還沒有真正開始研究這個問題。你同意這個觀點嗎?

【Jeff Dean】我認爲我們所做的一些工作已經開始涉及到建立人工智能系統。我們有一大堆不知道如何解決的事情,我們甚至不知道我們還需要什麼,這就是爲什麼這是一個開放且令人興奮的研究課題。但我堅信,我們今天所做的一些事情將成爲解決方案的一部分。

【問】所以你認爲你會在事業的巔峰期目睹AGI的出現嗎?

【Jeff Dean】未來是不可預測的。也許我明天就會遇到一場自行車事故,但我認爲,在未來的15到20年裡,肯定會有一些奇蹟發生,雖然有些事情我們今天是沒有辦法想象得到的,但無論如何十年、十五年、二十年之後我們一定會取得令人印象深刻的成就。

【問】那麼這會讓我們意識到AGI或者說是機器意識是一種完全沒有可能的事情嗎?

【Jeff Dean】我真的不知道。我傾向於不去探討什麼是意識的哲學辯論。對於我這種外行來說,意識只是生活系統中神經元的某種電子活動——它能意識到自己,能理解後果,如此等等。因此,從這個角度來看,意識似乎並不是什麼特別的東西。這似乎是一種類似於智能系統所展示的其他屬性

【問】所以,如果沒有你的自行車撞車事故,這個世界會變成什麼樣子呢?也許二十年後,我們在人工智能上取得了令人難以置信的進步,也許還有類似於AGI的東西出現?你認爲這一切會對整個世界造成什麼樣的影響呢?這對人類有好處嗎?

【Jeff Dean】我認爲這幾乎是一件好事。我認爲,如果你回顧一下之前取得的技術進步,比如從農業社會向工業革命的轉變。過去99%的人都在努力的種植糧食,而現在,在許多國家,只有百分之幾的人在從事糧食供應的工作……這樣讓人們有時間去做許多其他的事情,這都是這巨大變革後的結果。

所以,我認爲,就像任何一種技術一樣,也許不會帶來什麼驚天動地的改變,但總體而言,大很多方面將會因此而進步。一個真正的智能技術可能就是改變人類社會的一個槓桿。如果我有一個問題,一個非常複雜的問題——今天我可以通過搜索引擎來解決。但是當我想要了解一個特定的話題,並希望找到我需要的所有這些論文,然後閱讀並總結它們,那要怎麼辦呢。”

如果有一個智能系統我便可以對它說,“找到我所有關於機器人技術強化學習的論文,並對它們進行總結。”這個系統便可以運轉,在二十秒內就完成任務,這對人類非常有用。

三、學習能力開始成爲機器學習研究的一個重要領域

【問】那是當然了。那麼,你認爲有哪些挑戰讓我們與這個世界有隔閡?換句話說,我們在這個領域需要克服的最新障礙是什麼?

【Jeff Dean】在機器學習研究領域,我認爲非常重要的一點是,當我們想要爲某個特定的任務建立一個機器學習系統時,我們往往會需要一個機器學習專家參與其中。我們有一些數據以及計算,需要一個人類機器學習專家坐下來決定:好吧,我們想要解決這個問題,這就是我們大致的方法。之後我們便建好了一個系統,可以從提供給它的觀察中學習如何完成這項任務。

這就是機器學習的工作機制,將會推動當今世界上發生許多非常有趣的事情。這就是爲什麼計算機視覺在過去五年中取得了如此巨大的進步的原因,爲什麼語音識別功能的效果會更加出色,爲什麼現在的機器翻譯工作比一、兩年前好得多。因爲這一功能是非常重要的。

但問題是,你在構建這些狹窄定義的系統時,它們可以在一件事,或者一些事情上做的非常好。我們真正想要的是一個能做十萬件事的系統,然後當成百上千件以前沒有發生過的事情發生的時候,我們希望它從它的經驗中學習,能夠運用它在解決前幾十萬件事情中所獲得的經驗,從而能夠快速學會如何完成千上萬的事情。

但是對於這種學習機制,我們希望可以沒有人類機器學習專家的出現,去教會它如何去做百上千件事。

【問】這實際上可能就是AGI要實現的目標吧?

【Jeff Dean】我的意思是,隨着時間的推移,它會變得更像一個可以自我提升的系統,並且可以通過在已經知道如何做的基礎上增加新任務的能力。

【問】一般來說,這就是轉移學習,對吧?我們把某物放在一個空間裡,用它來影響另一個空間。這是一個新的研究領域,或者說是人們思考了很長一段時間的事情,我們只是還沒抽出時間來做而已。

【Jeff Dean】人們對這個問題的思考已經有一段時間了,但通常情況下,我會有很多想做的事情,只從中選出三個。隨後,去學習做三這件事,之後用較少的數據去做第四件事。 之後再給它新的任務,這一次,沒有任何人類參與,系統就能學會完成新任務了。

所以我認爲這是主要的區別。多任務學習和轉移學習已經在非常小的範圍內取得成功了。當然,我們需要這樣的實驗,以便我們能在更大的範圍內應用它們。

另一件新事物是元學習,它開始成爲機器學習研究的一個重要領域——本質上是“學習能力”。這樣就會有一個系統,它可以看到一個全新的任務,並根據它的經驗來學習完成它,也許它會做一些實驗來證明它可能想要嘗試去解決這個新任務。在我們需要嘗試不同的方式來解決問題以及加快機器學習進程的時候,通常需要人類的參與。

四、正在進行的項目:TensorFlow開源軟件包

【問】有些人擔心人工智能的發展會對人類的工作產生影響。最後因爲機器可以比人類更快地學習新任務,繼而社會中一羣人將會被高速的經濟發展所淘汰。你對此有何看法?

【Jeff Dean】顯然,計算機將會在一些層面上讓一些工作自動化,並且隨着時間的推移,能夠讓機器自動化取代的工作越來越多了。這種情況以前就發生過,比如從農業社會向工業型經濟的轉變,很大程度上是因爲我們能夠將農業生產的許多方面自動化,從而導致了工作崗位的轉移。

但是隨之人們發現了其他可以做的工作。所以,總的來說,我是一個樂觀主義者,我認爲,政治家和政策制定者應該思考,如果計算機能夠完成比以往更多的任務,那麼我們想要的社會結構應該是什麼樣子。我認爲這在很大程度上是政府和政策的問題。我的觀點是,計算機能夠實現很多事情的自動化,這些都是人類目前所從事的重複性工作,因爲它們太複雜,無法讓我們的計算機學會如何去做。

【問】那麼,如果我理解正確的話,你的意思是你不擔心大量工人會因爲科技而失業?你現在在人工智能領域正在涉及的事情是什麼呢?

【Jeff Dean】作爲一個團隊我們各有分工,所以我的主要工作就是領導我的團隊併爲我們現在做的項目提供一些指導。我們團隊正在進行的一些研究項目,我個人也參與其中,比如針對在醫療領域中使用機器學習。我認爲在未來,機器學習技術可以在醫療保健事業上做出重大的貢獻。

我個人就在研究,我們如何能夠建立合適的計算機硬件和計算機軟件系統,使我們能夠建立機器學習系統,從而能夠快速地嘗試各種不同的機器學習理念——這樣你就可以建立起一個可以擴展的機器學習系統。

這就是我們與硬件設計團隊的合作項目,確保我們打造了正確的機器學習硬件……TensorFlow是我們團隊開發的開源軟件包,我們在一年半之前開源——利用它我們得以表達我們的機器學習理念,並將其用作培訓我們機器學習系統的設備。

目前我們已經發布了這一系統,所以谷歌外部的很多人也在使用它,並希望在一段時間內共同改進它。我們也進行了一系列不同的研究工作,我個人非常密切地關注“學習“學習項目,因爲我認爲這將是一個非常重要的研究領域。

【問】許多人認爲,如果人類有能力創造“AGI”,那麼第一個一定會出自谷歌“之手”。這有可能嗎?

【Jeff Dean】好吧,我覺得在AGI之前,我們還有大量的未知和不確定性,因此它也可能來自任意一家公司。這個領域的研究非常的寬泛,但也十分重要,需要不斷的進步,我們正在努力建立能夠做更多事情的系統。但我想說,AGI是一個相當長遠的目標。

【問】那麼當谷歌達到一定大的規模的時候,自身也會增添一些不可預見的新屬性,你覺得是這樣嗎?

【Jeff Dean】不好意思我不是很理解這個問題。

【問】人類是不斷更新的,不是嘛?你有一萬億個細胞,它們並不知道你是誰,但是換句話說,你的細胞中沒有一個是有幽默感的,但你有。所以在某種程度上可以說,系統整體具有其單一部分沒有的特徵屬性。可能有些例子舉得不是很恰當。比如,當你看到一些數字時,如人腦中的連接數量以及數字世界中沒有的數據,再比如我們看到電子世界中相同類型的命令,需要我們的猜想。

【Jeff Dean】是的,我認爲人類的大腦和計算系統的能力相比,仍然有幾個數量級的差距。我們可能就像紐特一樣。但是,我的意思是,我們的目標是建立更智能的系統,隨着你計算能力的提升,這些系統將會變得更有能力。

五、機器學習將涉及更多的研究領域

【問】正因爲出色的GPU,更加完善的算法,全面的數據庫以及更先進的訓練集和摩爾定律,人工智能才得以在過去的10年內取得了巨大的成功。沒有比這更復雜的了嗎?這是由很多因素共同決定的嗎?或者是一些可能不被人注意到的分水嶺事件的發生,給我們帶來了現在人工智能的復興?

【Jeff Dean】所以,讓我這樣來描述一下:我們今天使用的很多算法實際上是在二十、二十五年前開發的,當時人們對神經網絡的興趣首次高漲,這是一種特殊的機器學習模式。二十或二十五年前在非常小的問題上出現過這個模式……但我們缺乏讓它們在大問題上良好運行的計算能力。

所以,如果你快速回到二十年前,大概在2007年,2008年或2009年,那時起我們開始有了足夠的計算能力,以及足夠大、足夠有趣的數據集,使神經網絡能夠解決實際的有趣的問題——比如計算機視覺問題或語音識別問題。

事實上,神經網絡已經成爲解決這些問題的最佳方式,因爲我們現在有足夠的計算能力和足夠大的數據庫。在過去的十年裡,我們做了大量的研究工作,來增加二十、三十年前用新技術開發出來的基礎算法。

GPU是其中一個有趣的方面,但我認爲最根本的是認識到神經網絡,以及機器學習模型。與今天在計算機上運行的大多數代碼有着不同的計算特性,這些特徵基本上都是線性代數的運算——矩陣乘以向量運算,而且它們還相當寬容地降低了精確度。所以當你在計算神經網絡的時候,你不需要精確的六到七位數—,僅需要更小的精確度 。

這兩個因素結合在一起,可以爲非常低精度的線性代數構建專門的硬件。這就增強了我們在這些問題上應用更多計算的能力。GPU是一件事,谷歌開發了一種新的定製芯片,叫做張量處理單元,TPU,它使用的精度低於GPU,並具有顯著的性能優勢。我認爲這是一個有趣且爆炸性的領域。因爲當你在構建專門針對某一子集的特定硬件時,而不是像CPU那樣採取非常普遍的計算方式,你就會面臨這樣的風險,即特定的子集只是你在計算系統中想要做的事情的一小部分。

但是,現今神經網絡和機器學習模型適用於非常廣泛的領域,比如語音識別和翻譯、計算機視覺、醫學和機器人技術。所有這些東西都可以使用相同的基礎元素,以此來加速線性代數——做完全不同的事情。因此,你可以開發適用於許多不同事物的專用硬件。

【問】我明白了。好吧,我想我們的採訪已經快到時間了。你還有什麼結束語嗎,或者我們可以期待從你的工作中看到什麼吸引人的成果嗎?

【Jeff Dean】我想我有很多成果想激動的和大家分享。我只列舉幾個……

我認爲機器學習在醫學和醫療領域的應用將是非常重要的。對於醫生和其他醫護人員來說,這將是一個巨大的幫助,讓他們可以快速的獲取病人的確切的病理信息,什麼對病人是最有效的,或者是解讀醫學圖像,併爲人們就醫療圖像提供有效的建議。

我對機器人技術很感興趣。我認爲機器人技術的機器學習將在未來5年、十年成爲一個有趣的新興領域。我認爲,這種“學習學習”的工作將帶來更靈活的系統,在不需要太多機器學習技能的情況下,它們可以學習做新任務。我認爲這將是一件非常有趣的事情,因爲它會不斷進步。

然後,在所有機器學習工作的背後,我認爲,在未來五年裡,打造專門針對特定類型機器學習模型的定製硬件的趨勢將會非常有前景

最後一個想法是,我認爲機器學習的領域不僅涉及計算機科學,還能涉及很多人們正在鑽研的領域。因此,我覺得目前的發展很振奮人心,因爲當人們意識到機器學習的光明前景便願意開始學習和做機器學習研究,並理解機器學習在不同科學領域或不同應用領域的意義。

在過去的五到八年時間裡,我們非常興奮地看到,越來越多來自不同背景的人正在加入這個領域的研究,並在這個領域從事着一些有趣的課題。(完)

點擊查看《AI英雄》專題,往期內容一步直擊!

注:《AI英雄》專訪隸屬本站智能工作室,圍繞人工智能領域講述人物故事,洞察技術趨勢,捕捉行業機會,關注人的價值。轉載請註明出處,違者必究!