ChatGPT到底有多聰明?我測試了ChatGPT的數學能力

來源:AI前線

譯者:馬可薇

人人都聽說過最新,也是最複雜的聊天機器人 chatGPT。而衆所周知,它在英文文學等“軟話題”方面甚是熟練,所以我決定測試它在數學這類“硬話題”方面的表現。你可能不知道,但我是有數學博士學位的,我可不會手下留情。

讓我們先從基礎的高中數學開始。

chatGPT的回答中只弄錯了“差的平方”,其他都沒問題,它甚至還舉了個例子。

數算錯了,答案不是5,是3.166。

3.4可不是個“很好的近似值”。

解答過程離題了,但答案是正確的。

只能說是錯。

這點倒是沒問題。

完全正確。

完全正確。

這題答錯了。

是隻有在不相交的時候。

GPT自己糾正了答案,回答正確。

完全正確。

正確,不過過程解釋錯了。

再一次地正確。

哈!它知道代數!如果一個數字是有理係數多項式的根,那麼它就是代數。

解釋得很好!

錯錯錯,大多特錯。如果兩個集合不相交,那麼交集的測度是 0。如果相交,則測度可以是 0 到 1/2 之間任何數。

既然如此,我準備趁早收手。ChatGPT 的表現雖然不是無懈可擊,但也比我想象中要好很多。我比較佩服的兩件事有:它在距離問題中控制變量的方式以及它在多個問題中使用的推理方式。舉例來說,它的推理過程大概如下:代數是可數的,任何可數集合的測度都是 0,因此代數的測度爲 0。

根據我的教育經驗來看,chatGPT 的數學水平大概是數學專業大二的水平。除了算術部分出了錯,其他都很好。讓我們給 chatGPT 來點掌聲!

查看英文原文:

https://billwadge.com/2022/12/15/just-how-smart-are-you-chatgpt-i-quiz-chatgpt-about-math/ by Bill Wadge

未來智能實驗室的主要工作包括:建立AI智能系統智商評測體系,開展世界人工智能智商評測;開展互聯網(城市)大腦研究計劃,構建互聯網(城市)大腦技術和企業圖譜,爲提升企業,行業與城市的智能水平服務。每日推薦範圍未來科技發展趨勢的學習型文章。目前線上平臺已收藏上千篇精華前沿科技文章和報告。