智譜上線首個深度推理模型預覽版,部分效果媲美o1-preview但與o3有差距

藍鯨新聞12月31日訊 12月31日,大模型獨角獸智譜AI發佈其首個基於擴展強化學習技術訓練的推理模型GLM-Zero-Preview。據智譜介紹,該模型專注於增強AI推理能力,擅長處理數理邏輯、代碼和需要深度推理的複雜問題。GLM-Zero-Preview在部分評測集中效果與OpenAI o1-preview相當,但與“o3模型還有不少的差距”。目前該模型已支持上線使用,智譜稱很快將會推出正式版GLM-Zero,將深度思考的能力從數理邏輯擴展到更多更通用的技術。(藍鯨新聞 朱儁熹)