炸鍋!斯坦福AI團隊,被曝抄襲中國大模型!各方最新迴應

斯坦福AI團隊抄襲清華系大模型一事,在AI圈炸開了鍋。

事件起因是5月29 日,一個由斯坦福學生組成的AI團隊發佈了一篇名爲《Llama 3-V: Matching GPT4-V with a 100x smaller model and 500 dollars》的文章,稱訓練出了一個開源多模態模型Llama 3-V。這一模型比 GPT-4、Gemini Ultra、Claude Opus 等模型能力更強,而且訓練成本只需要500美元。

Llama 3-V模型的團隊成員 Aksh Garg 在社交平臺X上發帖介紹了這一模型。該帖很快閱讀量便超過30萬,Llama 3-V 也很快衝上了全球知名開源社區HuggingFace的趨勢榜首頁。

隨後,有熱心網友發現,Llama 3-V與清華系大模型創業公司面壁智能的MiniCPM-Llama3-V 2.5在模型結構、代碼、配置文件等方面幾乎一模一樣,只是斯坦福AI團隊將其中的變量名稱做了更改。該網友更是直接將相關的關鍵證據一一截圖,進行列舉證明。

簡言之,Llama3-V疑似套殼抄襲了面壁智能的MiniCPM-Llama3-V 2.5。發現了這一問題的網友在Llama3-V頁面上提出了質疑,但Llama3-V頁面很快就被作者刪除了。目前,Llama3-V 的GitHub項目主頁已顯示爲“404”,HuggingFace上的Llama3-V項目已不可見。作者社交媒體賬號上,此前宣傳Llama3-V的內容頁已經遭到刪除。

6月3日,Aksh Garg在其社交平臺上發文迴應了質疑,他艾特另外兩名成員Siddharth Sharma和Mustafa Aljadery,並表示:“我和Siddharth都忙於自己的全職工作,所以Mustafa爲該項目編寫了所有代碼。我倆都對多模態模型感到非常興奮,並且喜歡他向我們描述的架構擴展,所以我們幫助他推廣該產品。”他還進一步表示:“在看到這些(抄襲)指控後,我們與Mustafa討論了Llama3-V的原創性證明,並要求提供訓練代碼,但到目前爲止還沒有看到任何證據。我們向原作者道歉,也對自己沒有盡職盡責地驗證其作品的原創性感到非常失望。”

公開資料顯示,Siddharth Sharma與Aksh Garg都是斯坦福大學計算機系的本科生,發表過數篇機器學習相關的論文。Siddharth Sharma曾在亞馬遜實習過一段時間,目前主要從事與AI和數據相關工作。Aksh Garg 則在SpaceX、斯坦福大學和加州理工學校等知名企業機構都實習過。Aksh Garg 所說的“編寫了所有代碼”的Mustafa Aljadery則就讀於南加州大學,目前其社交平臺X 賬號已被設爲隱私狀態。

值得注意的是,斯坦福 AI 實驗室主任 Christopher David Manning 在社交平臺發帖譴責了抄襲行爲,同時還對清華的開源模型表達了讚賞。

這一事件中的另外一個主角面壁智能也進行了公開回應。面壁智能CEO李大海在其朋友圈中發文表示:“技術創新不易,每一項工作都是團隊夜以繼日的奮鬥結果,也是以有限算力對全世界技術進步與創新發展作出的真誠奉獻。我們希望團隊的好工作被更多人關注與認可,但不是以這種方式。我們對這件事深表遺憾!一方面感慨這也是一種受到國際團隊認可的方式,另一方面也呼籲大家共建開放、合作、有信任的社區環境。一起加油合作,讓世界因AGI的到來變得更好。”

公開資料顯示,面壁智能成立於2022年8月,專注於大模型技術創新與應用轉化。創始團隊主要來自於清華大學自然語言處理實驗室(THUNLP),公司CEO李大海是知乎首席技術官(CTO),聯合創始人劉知遠是清華大學計算機系副教授、博士生導師。

天眼查顯示,面壁智能目前已完成兩輪融資。去年4月,公司完成由知乎、智譜AI投資的數千萬人民幣天使輪融資;今年4月,公司宣佈完成新一輪數億元融資,由春華創投、華爲哈勃領投,北京市人工智能產業投資基金等跟投,知乎作爲戰略股東持續跟投支持。

值得注意的是,李大海曾表示面壁智能是他作爲知乎CTO發起的唯一一個項目。作爲中等梯隊的互聯網上市企業,知乎面對全新的技術浪潮,想要熱情擁抱,又無法如創業公司一樣全情投入其中,於是選中面壁智能,作爲AI大模型浪潮中對知乎技術力量的補充。而知乎所掌握大量中文互聯網優質語料,也爲面壁智能開展大模型訓練提供了豐富的數據。

去年4月,知乎與面壁智能宣佈聯合研發的首箇中文大模型“知海圖AI”和應用“熱榜摘要”正式面世。除此以外,雙方在面壁智能研發的中文基座大模型CPM-Bee10b、對話類模型產品“面壁露卡”,以及內測第二款知乎場景下的模型應用“搜索聚合”等方面,也開展了廣泛深入的合作。

校對:李凌鋒

版權聲明

證券時報各平臺所有原創內容,未經書面授權,任何單位及個人不得轉載。我社保留追究相關行爲主體法律責任的權利。

END

" Type="normal"@@-->