開發者如何用好OpenAI o1模型?5大有趣應用值得一試!

智東西編譯 楊蕊伃編輯 漠影

智東西9月14日消息,據VentureBeat昨日報道,美國大模型獨角獸OpenAI發佈了增強推理能力的大語言模型,包括o1-preview和更簡化的o1-mini(OpenAI草莓模型深夜突襲!理化生達博士生水平,比GPT-4o強多了,ChatGPT可用)。據悉,這兩個新模型將爲開發者提供強大的推理能力,特別是在科學、技術、工程和數學(STEM)領域。

目前,這兩個模型已向ChatGPT Plus用戶以及使用OpenAI付費API的開發者開放。因此,開發者現在可以在現有的第三方應用和服務中測試這些模型,或者利用它們構建新的應用和服務。

o1-Preview和o1-mini模型目前專注於文本處理,在編碼和文書起草上表現出色,還能夠進行計劃生成、風險評估、創建應用程序和遊戲、自動完成提案請求、策略化參與等,但在內容快速響應方面還有待提升。

不過,o1系列模型並不是多模態的,在某些應用場景下並不能完全替代GPT-4o,如圖像輸入、函數調用等。

據悉,o1系列模型目前僅向“Tier 5”級別的用戶羣體開放,且暫時不支持批量請求,每分鐘最多處理20個請求,不太適用於需要快速連續響應的應用場景。

其中,o1-preview模型在提供廣泛的“世界知識”方面表現出色,是OpenAI目前提供的最昂貴的AI模型。

開發人員可以通過OpenAI的公共API以及微軟Azure OpenAI Service、Azure AI Studio和GitHub Models來訪問這些新的OpenAI o1模型。

一、多模態功能缺失:o1系列模型僅支持文本處理,無法完全取代GPT-4o

新的o1模型採用了一種“推理”機制,OpenAI稱,它們會“嘗試多種策略,識別錯誤,並進行完整的思考過程”。OpenAI的API技術負責人Michelle Pokrass在接受VentureBeat的視頻電話採訪時,分享了模型開發背後的一些理念。

Michelle Pokrass稱:“在我們的測試中,這些模型在一些最具挑戰性的基準測試中表現的像博士生一樣。”OpenAI的產品負責人Nikunj Handa也向VentureBeat表達了他對o1模型家族的看法。他認爲,o1模型在處理“推理相關問題”方面“比GPT系列表現得要好得多”。

o1-preview和o1-mini模型目前僅支持文本輸入和輸出,這意味着它們在功能上還無法完全取代GPT-4o。GPT-4o是OpenAI當前最先進模型,它不僅能夠處理文本,還支持多模態輸入和輸出,包括分析文件附件和生成圖像。因此,對於需要這些高級功能的第三方開發人員來說,GPT-4o仍然是更合適的選擇。

根據Pokrass和Handa的說法,o1系列模型並不是多模態的。此外,這些模型目前還不能瀏覽網頁,因此無法獲取2023年10月之後的新信息。不過,用戶可以通過文本輸入來提供最新知識,供模型參考和分析。

在生成輸出時,它們的速度也較慢,有時需要超過一分鐘,在某些情況下甚至可能需要幾分鐘。

▲用戶反映o1-preview模型生成速度有時候有點慢(圖源:X截圖)

一些獲得早期訪問權限的開發者反饋,這些模型在編碼和起草法律文件等任務上的性能有所提高。因此,對於願意嘗試併爲更高效能支付額外費用的開發者而言,o1-preview和o1-mini模型仍然是值得考慮的選擇。

就像OpenAI在其o1-preview和o1-mini推理模型的API文檔中所說:“對於需要圖像輸入、函數調用或快速響應的應用程序,GPT-4o及其mini是合適的選擇。然而,如果您的目標是開發需要深度推理並能容忍較長響應時間的應用程序,o1模型可能是更好的選擇。”

二、o1系列限制每分鐘最多20個請求

o1-preview和o1-mini模型最初僅向“Tier 5”用戶開放,這是指那些通過API消費達到1000美元,並且至少在30天前就已經向公司支付過費用的用戶。

OpenAI稱,新o1模型系列目前處於預覽階段,與其他模型相比,它們有特定的使用限制。o1模型的限制是每分鐘最多20個請求,這意味着它們不適合需要快速連續響應的應用場景。此外,o1模型目前不支持批量請求,這與OpenAI的其他模型不同,後者可以將請求集中處理,通常在24小時內返回結果,且成本較低。

據OpenAI的API技術負責人Michelle Pokrass介紹,o1-preview模型提供了更多STEM之外學科的“世界知識”,是目前提供的最昂貴的OpenAI AI模型。其價格爲每輸入100萬個token 15美元,每輸出100萬個token 60美元。相比之下,GPT-4o的價格爲每輸入100萬個token 15美元,每輸出100萬個token 4美元。這意味着,o1-preview模型的價格比GPT-4o高出200%到300%。

對比之下,o1-mini模型的價格較爲經濟,其費用爲每輸入100萬個token 3美元,每輸出100萬個token 12美元,這比o1-preview模型便宜了80%。

Pokrass說:“當然,我們將在接下來的幾周和幾個月內調整定價,以將其調整到合適的水平。”

▲OpenAI各種領先模型的定價明細

三、o1系列模型能做什麼:生成計劃、評估風險、創建遊戲、請求提案、增長黑客……

在處理上下文方面,o1系列模型的限制與GPT-4o以及其他OpenAI的頂級模型相當,能夠處理最多128000個token,這包括了輸入和輸出。

o1-preview模型在單次輸出或響應中最多可以生成32768個token,而o1-mini可以生成雙倍的數量,即65536個token。

此外,部分開發人員在o1-previews和o1-mini發佈後就開始考慮如何使用它,並對其進行測試,看看它能做什麼,不能做什麼。

基於這項工作,以下是o1-preview和o1-mini模型迄今爲止最有趣的一些用途。

1、生成計劃和白皮書:一些用戶報告稱,o1模型系列能夠生成詳盡的行動計劃和完整的文檔,比如僅憑簡單提示就能生成引用充分的白皮書。

▲o1-preview能生成關於企業生成式AI用例的白皮書(圖源:X截圖)

2、規劃、基礎設施和風險評估:AI影響者和企業顧問Allie K.Miller在X上分享了一系列的OpenAI o1-preview模型的輸出示例,這些示例展示了該模型在多個領域的應用能力,包括優化員工的組織日程安排、評估合併風險、設計更高效的倉庫,以及平衡城市電網等任務。

3、快速創建應用程序和遊戲:OpenAI的o1-preview模型似乎是對Anthropic的Claude系列,尤其是其Artifacts功能的直接競爭,因爲它同樣爲用戶提供了一種強大且快速的方式來生成自己的交互式應用程序和遊戲。

▲o1和Cursor Composer能創建應用程序(圖源:X截圖)

4、自行完成提案請求(RFP):承包商,特別是那些爲政府機構提供服務的,對提案請求(RFP)非常熟悉。RFP是機構以標準化格式徵求合同投標的一種方式,這個過程既繁瑣又耗時。賓夕法尼亞大學沃頓商學院的教授Ethan Mollick在X上發佈消息稱,o1-preview模型能夠自主填寫RFP,儘管它僅限於文本輸入,並且不接受文件上傳。

5、策略化參與和增長黑客:EasyGen是一款用於自動生成LinkedIn帖子的Chrome應用程序,其創始人Ruben Hassid在X上發佈了一段演示視頻,展示了o1-preview模型如何能夠生成一個全面且合理的計劃,以使用Reddit來幫助他的公司發展。

然而,網絡通知初創公司Engagespot的首席技術官Anand Sukumaran認爲,GPT-4o在編寫簡單程序時速度更快。

結語:OpenAI將繼續優化o1及GPT系列模型,給用戶提供更多的應用構建選擇

VentureBeat作者認爲,儘管o1系列可能並不適合部分開發人員,但它的推出對於那些有實驗空間並希望開發新應用程序和服務的開發人員來說,無疑是一個激動人心的時刻。

OpenAI還承諾將繼續推進o1系列及其GPT系列的能力,這意味着那些希望在這家AI公司的平臺上構建應用程序的開發者將擁有豐富的選擇。

隨着這些模型的不斷優化和升級,它們將在諸如文學、藝術等更多領域展現出應用潛力。

來源:VentureBeat