OpenAI“草莓”推理大模型兩週內就要上架?用戶恐將面臨耐心考驗

財聯社9月11日訊(編輯 史正丞)沉寂了數月的全球AI龍頭OpenAI,似乎馬上要有大動作了。

根據《信息報》週二援引多名知情人士報道,OpenAI計劃在大約兩週時間裡,正式推出以推理能力爲核心的“草莓”AI模型,並加入ChatGPT服務。由於OpenAI CEO奧爾特曼等人對“草莓”的大力宣傳,疊加公司的確也有一陣子沒有令人興奮的消息了,外界對於這個新產品也算是有一定的期待。

會主動“沉思”的大模型

報道稱,作爲以推理爲賣點的大模型,“草莓”在面對複雜、多步驟的提問時,會比現在的GPT-4o能力更強、更加易用。

在使用GPT-4o時,如果要提出一個多步驟推理的問題,爲了避免機器胡亂回答,用戶往往需要明確告知機器人解答問題時的每一個推理步驟——類似於輸入“思考鏈的提示詞”。使用“草莓”時則沒有那麼麻煩,輸出的結果也會更好。例如,這個模型能夠解答《紐約時報》字謎遊戲。

(來源:《紐約時報》)

因此,除了數學、代碼外,“草莓”也適合回答更加寬泛、主觀的問題。例如要求它“頭腦風暴”一個市場營銷策略,“草莓”給出的回答更加貼近用戶所在的實際場景,也更加關注細節,例如生成一個以周爲單位的執行計劃。

造成回答質量差異的核心原因,在於“草莓”模型不會立即回答用戶的提問,而是會進行“思考”,也會向用戶提出追加的問題,從而更加全面地給出答案。

當然,這個步驟也是“草莓”作爲互聯網產品的潛在弱點——報道稱,模型可能需要10-20秒的時間纔會開始回答問題。對於日益強調與AI實時交流的行業而言,付費用戶能否接受交互間隔拉大到十秒以上會是個問題。

更致命的問題是,在回答一些GPT-4o也能推理的問題(事實上人類至今都不清楚AI的能力邊界在哪裡),“草莓”可能會出現思考一段時間後,只給出稍稍好一些的回答。體驗過這種差異的知情人士稱,結果的提升並不值得等待這麼長時間,能做到“脫口而出”的GPT-4o反而體驗更好。

知情人士同時表示,在內部測試中,“草莓”也出現難以記住對話歷史等問題。同時這個模型目前只能輸入和輸出文字,並不能處理圖像,尚未跨過關鍵的多模態門檻。

商業策略也是看點

即使爆料準確,這件事情的看點除了“草莓”本身的能力外,還有OpenAI對商業策略的考量。

根據早些時候的報道,OpenAI在內部商討中,考慮給即將推出的推理專長“草莓”大模型,或下一代旗艦模型Orion訂一個更高的價格。更符合實際的操作是,OpenAI可能會在現有的ChatGPT Plus外新增一個付費檔次,提供“草莓”的無限制訪問或響應速度提升。當然,這一切的前提是有大量用戶認可“草莓”能力的提升。

在目前的定價體系中,面向個人用戶的ChatGPT Plus每月收費20美元,企業用戶的收費標準介於每月25-60美元/每個賬號不等。

上個月曾經有消息稱,OpenAI每月能通過企業服務和ChatGPT訂閱賺到2.83億美元的收入,但公司層面依然處於淨虧損的狀態。