中國論文遭大撤稿 陸汝鈐院士:學術道德氣氛營造不夠

作者|章劍鋒

出品|本站科技《科學大師》欄目

俄烏開戰後,西方國家不僅打出金融核彈,將俄羅斯踢出SWIFT(環球銀行同業金融電訊協會),並且發起高科技卡脖子,全面限制俄進口計算機和電子產品等一系列商品。

有聲音認爲,這對中國是又一次提醒,不自力更生,不擁有自己的科技原創能力,是不行的。

中國正在推進創新型國家建設,今年已經明確要把科技自立自強作爲國家發展的戰略支撐。

“必須走別人沒有走過的路,不能老跟在別人屁股後面,那樣你永遠做不出開創性的工作。”中國科學院院士陸汝鈐對本站科技《科學大師》說,搞科研不能固步自封,要敢想敢試敢於挑戰。

今年87歲的陸汝鈐院士,是中國人工智能領域的開拓者和先驅之一,中國人工智能最高獎“吳文俊人工智能最高成就獎”的首位獲得者,師承著名數學家華羅庚先生。

陸汝鈐在國際上率先研究異構型分佈式人工智能(DAI),把機器辯論引進人工智能,設計並主持實現分佈式邏輯推理和基於分佈式推理的城市交通管理軟件等成果應用 。在大知識工程方面,也有着國際學界承認的科研建樹,給出了大知識和大知識工程的初步定義及其生命週期模型,指導實現了全生命週期大知識圖譜支撐平臺。

在人工智能領域,中國是投入最多的國家之一,根據國家人工智能三步走戰略,到2025年,中國人工智能基礎理論要實現重大突破,部分技術與應用達到世界領先水平,2030年則要實現人工智能理論、技術與應用總體達到世界領先水平,成爲世界主要人工智能創新中心。

40年來,一直在人工智能領域潛心鑽研的陸汝鈐,經歷過人工智能的低潮,也看到了當前人工智能的熱潮,他告訴本站科技《科學大師》,人工智能的應用是國際比拼的焦點,誰能率先實現商業應用,誰就能領跑。但對於科學家來說,不能跟風湊熱鬧,要尊重科學規律,同時他也提醒那些在追逐一輪又一輪風口的人們,要理性,要有科學辨識能力,以免掉進騙局裡。

1、人工智能理論西方原創,

但中國科學家並非無所作爲

《科學大師》:我們國家提出要加強原創性引領性科技攻關,在科研上摸索了一輩子,您自己的體會是什麼樣的,在科研創新上有什麼方法?

陸汝鈐:對於我來說,做研究不是一味跟隨社會上的什麼潮流風口去趕時髦湊熱鬧,有一個重要的驅動力是個人的興趣推動,一般來說可能不是每個人都認同這一點。

比如我最感興趣的一項研究是計算機動畫的自動生成,它是人工智能的一塊試金石,人工智能有沒有解決問題的能力,可以在其中試一試,因爲這裡面所需要的新技術是無窮的,有數不盡的創新點待我們去開發。所以我的感受就是做科研一定要從內心感到興趣,否則你不會有決心長期坐冷板凳。

當然,在這個基礎上,搞創新也不能閉門造車,你還得密切關注世界科學發展的潮流和前沿,特別是本專業的發展趨勢,從裡面會發現新的空白點。另外,還要根據國家的迫切需要,主動迎合響應,讓科研能夠解決實際問題,同時你也得符合科學研究的規律,既不能固步自封,也不能異想天開,要腳踏實地一步一步地向前走,這中間也要有一種初生牛犢不怕虎的勇氣,敢想敢試敢於挑戰,要有捨我其誰的大志向。

創新就是這樣。我以前給學生布置題目,有的學生第一反應說這個問題沒人做過,或者說這個方法沒有人試驗過。我是最不喜歡這種說法的,沒人試過你就不能試了?你就不能第一個做了?必須人家在前面做過了,你再去做?別人都做了,還要你幹什麼?

《科學大師》:有一種說法是,人工智能基礎理論都是西方原創,我們中國科學家有能力重新構建一套嗎?

陸汝鈐:現代人工智能確實最早起源於西方,但人工智能作爲一門科學是不斷髮展的,許多國家都做了貢獻,我們中國也不例外。不過不是重新構建一套,而是不斷創新。

比如吳文俊院士(中國科學院1955年學部委員、著名數學家、國家最高科學技術獎獲得者),他的數學機械化理論就是原創,我記得國外有一本最有代表性的權威人工智能雜誌,叫《artificial intelligence》,就專門用了一期的專題討論他的理論,這是很不容易的,說明中國科學家在人工智能領域也有開創性貢獻。

吳先生在上世紀70年代就開始研究數學機械化並發表這方面的第一篇文章,當時人工智能研究在中國還沒有興起。

還有原來吉林大學的王湘浩院士(中國科學院院士、著名數學家),很早研究定理機器證明,還在1979年就組織了全國的人工智能研討會,那次會議我也參加了,學到很多東西,也是推動我從事人工智能的重要關鍵點。他還推動知識工程研究,組織學生很早就開發出一些專家系統,支持國家建設,培養了一大批人才。

這說明中國的科學家是有遠見、有眼光的,能夠站在科學發展的潮頭,引領科學的發展。

《科學大師》:基礎都是人家的,我們還有別的路可走?

陸汝鈐:我說了,基礎並不都是人家的。從理論上說基礎也沒有一個終極的侷限性,它是可以繼續發展的。例如,最近北郵的鐘義信教授提出要重視人工智能基礎研究,主張把歷史上出現的各種人工智能研究機制綜合起來,推陳出新,並把這種理念稱之爲機制主義。我覺得就很有道理。如果說要走“別的路”,也許這也算吧?

其實,“路”就在我們眼前。只不過路不是現成的,是探險者開闢出來的。攻克科學難題,是路;直面國家需求,更是路。在這方面,對科學家有一個特殊的要求,就是科學必須能走別人沒有走過的路,一定是這樣的。不能老是在別人走過的路上添點花加點草,那樣你會永遠做不出開創性的成果。

2、發論文很重要

但不是創新的唯一衡量指標

《科學大師》:衡量一國人工智能科研水平,高影響力的論文(指引用次數及發表量)是重要的維度,您是多份學術期刊的編委,領域內這些年高影響力論文的表現怎麼樣?

陸汝鈐:重視高影響力論文的數量和被引用次數,我認爲是有道理的、必須的,因爲引用次數越多,表示大家對你的研究的關注程度越高,但是我覺得也不應該太極端。因爲很可能有些重要的創新思想在初期並沒有人注意到,如果你只是以論文引用率作爲唯一導向,可能就會產生誤導,甚至於錯失創新的機會。現在國內已經提出不要唯SCI引用,不要唯影響因子高;還有單位考覈時只要求個人提供少量代表性論文,多了不算數,就是針對把論文指標過度定量化的。

舉一個最極端的例子,錢學森先生的導師馮卡門教授,是國際非常有名的科學家,馮卡門有一篇開創性論文,開始居然沒有被著名的科學刊物採用,後來是在一個非常普通的雜誌上登出來的。德國著名科學家佩特里的許多重要論文都是以技術報告形式發表的,但卻被學術界視作經典。我國民間有諺語:“英雄不問出身”,對學術論文也應該不問出身。

《科學大師》:去年《自然》雜誌報道說, 2021年國際上的科學期刊撤回370篇和論文工廠有關聯的稿件,而大多數問題論文來自中國,特別是醫院,您怎麼看這種大量撤稿的事情?

陸汝鈐:論文是我們人才考評的重要依據,但如果片面強調,就會出這種問題,其根源在於我們對於學術的誠實性或者嚴謹性強調還不夠,在學術道德方面的氣氛營造工作也做得還不夠,所以這種事就有些防不勝防。

據我平時的觀察,發問題論文主要還不是學生,以在職的研究人員爲主。如果把論文作爲提升職稱或職務晉升的唯一考覈標準,這肯定會出問題,所以不但需要加強學術道德的教育和宣傳力度,用人考覈機制也要進行改革,這樣才能減少這種現象。

至於你提到的醫學界撤稿比較突出,這有着深刻的社會原因。由於醫療資源緊張,臨牀醫生們往往超負荷工作,可同時有些單位又要求他們發表高質量論文,否則職稱提升無望。在重重壓力下就容易出現這種現象。而這種狀況又被社會上的投機勢力利用來發不義之財。我認爲應該在改革職稱評審制度和打擊社會投機勢力兩方面同時下手,才能解決這個問題。

2018年,中國人工智能最高榮譽“吳文俊人工智能最高成就獎”頒獎現場,陸汝鈐院士(右二)攜家人出席。/圖片由受訪者提供

3、人工智能國際比拼

誰最先投入應用誰就搶佔制高點

《科學大師》:國際上在人工智能科研方面的比拼競爭,焦點或重心是什麼?

陸汝鈐:人工智能比拼主要還是在應用方面,就是說誰能最先把某些應用開發出來,誰就佔領了人工智能高地。

像軍事方面的應用,比如現代戰爭,會用到無人機,有人機跟無人機混合編隊怎麼對抗,可能是非常重要的問題,影響巨大,因爲未來的空戰很可能就是有人機和無人機混合編隊互相較量的戰爭。

歷史上的教訓就是這樣,在科學上一旦出現了某種新的技術或者新的理念,守舊的那一方肯定是輸定了。人工智能也會是如此。

當然有些國家可能已經掌握先進的人工智能技術,卻不一定公開,也不可能發文章討論,只有在發生事情的時候纔會用出來。實際上這對我們的挑戰就更嚴峻了,我們在這方面的研究肯定不能落後,需要抓緊。

4、人工智能大規模應用

需要跨越這些坑和坎

《科學大師》:人工智能技術不斷在發展,有什麼需要特別注意和當心的問題?

陸汝鈐:在人工智能應用上,有一個坎比較難過,凡是涉及重大的國家利益或者人的生命安全,現在還不敢讓計算機來自主做決定,比如病人,醫生給他開藥方和機器人給他開方子,是不一樣的。現在要讓機器人來開藥或者做手術,這在一定水平上都能做到,但還得有人監督着,畢竟人命關天,還不能夠完全放手。

另外,人工智能的倫理挑戰,確實也是值得重視。如果有一種人工智能,它能提前判斷胎兒的性別,甚至於去改變性別,這就很有風險,在人工智能應用上肯定就要劃出禁區。

再有,像能不能允許機器人在執行特別任務的時候主動殺人,這也是爭論焦點。

在人的控制之下,機器人可以執行指令,比如遇到綁架劫持,對於犯罪分子怎麼勸都沒用,這時候就可以派機器人把罪犯幹掉,這個事只能由執法機構來決策,不應該由機器人自主決策。

這是因爲如果授予機器人完全主動的能力,讓它自行判斷決策,會存在很大風險,當前還沒有辦法讓機器人有這種能力,去判斷什麼人該殺什麼人不該殺,什麼情況下可以殺人什麼情況下不可以殺人。

我們中國在這方面是有相應限制的,但美國人在這方面放得比較寬,他們是允許機器人自主決策的。

在人工智能的社會功能方面,我總的觀點是:人工智能就好像一把槍,它起的作用是好是壞,要看它掌握在什麼人手裡。

《科學大師》:人工智能的發展依託於大數據,一直以來大家都非常關心數據被濫用的問題。

陸汝鈐:這肯定是應該注意的,我也注意到有一些企業平臺利用大數據做不恰當的事情,比如大數據殺熟,如果你是個老顧客,平臺覺得你反正離不開我,那以後東西我賣你就貴一點。

再像你快遞上的個人信息,被人拿出去賣,或者在疫情期間,商家要你掃碼登記,你的地址、電話號碼、身份證號碼都掃出去了,有些人獲取後,也可以拿去賣錢。

從國家監管來講,是可以有安全手段保護大家的,比如我對你這個人的認知是零,你是個好人還是個壞人,我也不知道,這個沒關係,你的信息都在公共系統上,你去住酒店,其實並不需要酒店人員查你的個人信息,只要把你身份證在系統上一刷,你的個人信息直接就傳到公安部門了,中間的商家只知道你是否是合法顧客,除此之外不瞭解、也沒有辦法擴散你的個人信息,一旦將來有事情,警察就可以從系統上查到你。

這些技術都是可以做到的,這就是信息保護。

《科學大師》:具體到人工智能商業化,多年來包括科研人員在內都有討論,就是投機、虛火的現象,這種非理性行爲是不是也會破壞領域的發展?

陸汝鈐:確實是這樣,有些人跟風跟得很快,現在不是元宇宙很熱麼?以元宇宙的名義行騙的已經很多了。

元宇宙實際上就是虛擬現實的擴大,把真實的環境跟虛擬的環境組合在一起,它肯定是有用的,但我認爲沒有有的人說的那麼玄乎,好像今後人工智能就是元宇宙獨大了,現在不是很多公司都把元宇宙作爲自己的發展方向嗎?包括元宇宙方面的股票交易也是搞得很活躍。我覺得這是一股風,但是在跟風之前,大家還是要頭腦冷靜想一想。

從本質上來看,元宇宙一個最大的用處還是娛樂,而不是真正參與生產活動。

如果你一家人分散在全國各地,特想全家在一起吃年夜飯,元宇宙可以提供一個虛擬空間讓大家坐在一桌,每個人有一個虛擬人代表在一起吃飯,這是可以的,元宇宙也就是起這種作用,因爲都是虛的。其他就沒太大用處了。

至於說很多人想從中賺快錢,這源於一般人的趨利心理和本性,看到什麼地方有利益他們就往什麼地方鑽,這需要有相應的政策規範來限制他們,也需要有科學理論上的普及,讓大家瞭解元宇宙的實質。

5、人機專家會診治病救人,

這種智能化50年內可實現

《科學大師》:您今年87歲了,還在帶學生,您目前對人工智能發展的思考或關注側重點是什麼?

陸汝鈐:有些博士生還沒有畢業,所以還在帶。我重點關心的是大知識的發展問題。在上世紀末(1997年),大數據這個概念在國際上被提出來,引起社會廣泛關注,到2010年,學界又提出很多大數據的標準模型(三V、四V、五V等,這裡英文字母V代表以V打頭的一個英文詞,例如volume代表數量大,velocity代表數據產生速度快),在討論大數據時也提到了大知識,一個重要問題是怎麼從大數據中獲取大知識,因爲我們面對的海量數據,它裡面能獲取的知識一定也應該很多。

在現實生活中我們面臨着很多從大數據生成大知識的問題。比如上海市在2019年做了5年一次的第六次全市綜合交通調查,得到大量數據,上海有多少條公交路線、每天有多少人出行、上班族在路上要花去多少時間等等,這些經過整理、分析的數據,以及從中得到的相關結論就構成了有關上海市交通的大知識。

再舉一個例子,中國歷史大家知道從黃帝開始,經夏、商、週一代一代下來的,但國外有人一直否認,認爲中國沒有5,000年曆史,不存在夏朝,那麼你要反駁,就要去做考古,獲取大量考古信息和數據,證明中國歷史確實有五千年,確實存在過夏朝,並且從哪一年到哪一年有幾個皇帝,每個皇帝在位時間等等,這就是有關中國遠古歷史的大知識。

但是儘管許多人都提到大知識,國內外卻一直沒有人出來給出大知識的規範定義,更沒有人給出過類似於3V、4V、5V大數據模型這樣的大知識模型。我們從2016年開始研究這個問題,到2019年發表第一篇論文,其中給出了大知識的5MC模型,大知識系統的10MC模型(這裡M代表海量,C代表特徵),以及大知識工程的生命週期模型。接下來,如何從大數據獲取大知識將是我們的重點研究課題。

《科學大師》:包括大知識工程在內,目前人工智能從基礎科研到商業應用,發展得怎麼樣?

陸汝鈐:有些方面現在已經做得很好了,在實際應用中像模式識別,以醫學爲例,已經能區別出人體內的正常細胞和癌細胞。但是目前主要還是在科研階段,離商業應用還有距離。現在還沒有任何醫院敢於把疑難病人直接交給人工智能去全權處理。

我們比較關心人工智能在醫學方面的應用,讓人工智能造福人類健康。但是爲了實現這個目標,單純發展人工智能的某一方面技術肯定是不夠的。醫學人工智能需要的是人工智能技術的全面發展。我們目前的切入點就在於如何構造和利用醫學大知識來支持機器人醫學專家。

我們每個人去醫院看病,對一些疑難雜症,醫生會組織會診,有很多專家來討論,他們會有不同的意見,通過會診最後形成一個治療結論。

我們也想讓計算機和人類專家一樣參加會診,比如會診的時候有5個是真人醫生,另有5個是計算機代表,討論的時候,你區分不出來哪個參加者是人,哪個參加者是計算機。

如果能夠實現,很多醫療問題將來就都可以由計算機解決,比如我們開展網上的自動化醫療,任何一個病人有需求,病不是非常嚴重,在網上就可以諮詢機器人,由機器人給出方案。這是一項實實在在的大知識工程。

《科學大師》:這中間需要攻克的技術障礙是什麼?

陸汝鈐:機器不具備人的感知、意識等等,在醫院裡會診,各科室都有自己的專家和知識,每個醫生經驗都不一樣,機器人與此類似,人機協同會診就是不同的機器人專家和人類專家的聯合會診。

要讓機器人專家參加會診,是一個比較難的問題,需要用海量的醫學大知識(包括最新的醫學科技進展)來武裝它、支持它,這就涉及大知識的獲取、整理和昇華的問題。

但這不是問題的全部。醫生會診還是一個涉及多學科信息交流、問題分析、方案制定的過程,不僅有會商,還可能有激烈的辯論。能想象一羣人類專家和機器人專家面對面坐在一起就重大決策進行辯論並最後決策嗎?這就是主要難點之一。

另外還要想到人類專家是按領域知識和學科分類區別的,機器人專家也不例外。這不僅對機器人專家的醫學智能提出了很高的要求,而且還增加了他們交流合作的困難。

《科學大師》:這種計算機參與會診的人工智能模式,需要多長的週期實現?

陸汝鈐:科學家正在研究這個問題,如果要求在醫學領域全面實施人機會診,也許50年內能實現,我覺得不一定需要100年時間。到時候大家上醫院看病,會診專家當中沒準就有機器人了。在人工智能領域的重大應用中,我覺得這應該是能率先實現的目標。