OpenAI最強推理模型o3發佈 AGI能力暴漲

今日(12月21日),OpenAI“連續12日聖誕發佈”終於迎來激動人心的大結局,OpenAI推出重磅收官新品,其迄今最強前沿推理模型的升級版——o3。

OpenAI號稱o3在一些條件下接近通用人工智能(AGI),共有o3和精簡版o3-mini兩個版本。

評估顯示,o3在軟件工程測試中準確率比o1高近47%,競賽數學測評的準確率比o1高15%,人類博士專家級生化物測試中準確率比o1高近13%。

AGI相關測試中,o3最佳成績87.5,超過人類水平門檻85,顯示邁向類人智能取得突破。

對比之下,GPT-3的評測結果爲0%,GPT-4o爲5%,而o3一舉將成績提升到87.5%。

OpenAI計劃明年初發布o3系列模型,CEO Altman暗示可能一段時間內都不會面向大衆上線這類模型,稱希望正式發佈前,先有一個聯邦政府的測試框架,指導監控並減少這類模型的風險。

從本週五開始,OpenAI允許安全研究人員可以註冊訪問o3和o3-mini的預覽。