人工智能編程助手竟讓代碼錯上加錯!

生成式人工智能的支持者聲稱,該技術能夠讓人類工作者的生產力更高,特別是在編寫計算機代碼方面。

但真的是如此嗎?

最近由編碼管理軟件企業 Uplevel 所進行的一份報告 ,首先由 IT 雜誌 CIO發現,表明使用 GitHub 熱門的 AI 編程助手 Copilot 的工程師在效率方面未取得任何顯著的提升。

該研究稱,要說的話,使用 Copilot 會導致無意中輸入到代碼裡的錯誤會增多 41%。

在這項研究中,Uplevel 在 800 名開發人員獲得 Copilot 之前對他們的表現進行了三個月的跟蹤。在他們獲得 Copilot 之後,Uplevel 又對他們跟蹤了整整三個月。

要衡量他們的表現,Uplevel 查看了開發人員把代碼合併進存儲庫(也就是拉取請求)所耗費的時間,以及他們提交請求的數量。

Uplevel 發現:‘Copilot 在樣本中既未幫到也未傷到開發人員,而且也沒提高編碼速度。’

“我們團隊的假設是,我們認爲公共關係處理的週期時間會縮短,”Uplevel 產品經理兼數據分析師馬特·霍夫曼告訴CIO。 “我們認爲他們能夠編寫更多代碼,而且我們實際上認爲缺陷率可能會下降,因爲您在推出代碼之前使用這些生成式人工智能工具來幫助您審查代碼。”

當您意識到 GitHub Copilot 以大型語言模型(LLM)爲中心時,所有這些信息就不那麼令人驚訝了,這些模型往往容易產生錯誤信息的錯覺並輸出不正確的數據。

最近,由德克薩斯大學聖安東尼奧分校的研究人員領導的另一項研究發現,大型語言模型能夠生成大量的“虛幻數據包”,即“推薦或包含對不存在的文件或代碼的提及”的代碼。

科技領袖們開始擔心,使用人工智能生成的代碼最終可能實際上會帶來更多的工作。

“理解和調試由人工智能生成的代碼變得愈發具有挑戰性,故障排除耗費的資源如此之多,以至於從頭重寫代碼要比修復它來得容易,”軟件開發公司 Gehtsoft 的首席執行官伊萬·格赫特告訴CIO。