ChatGPT 高級語音登 Mac 和 Windows,獲取攻略速看

OpenAI 終於把高級語音模式引入了桌面端。它在 Windows 和 Mac 系統的ChatGPT 應用程序版本中均可使用,並且與移動版本的工作方式相同。

這意味着您終於能夠和您的計算機進行對話了。不是像您與 Siri 或 Alexa 交流的那種方式(沒錯,我口述這段文字時,它們都被觸發了),而是像您 與另一個人交談 那樣的完整對話。

高級語音屬於原生的語音到語音模式。這意味着 OpenAI 的語音機器人可以理解您說的一切、您說話的方式,甚至您單詞之間的停頓。它的迴應同樣自然,包括添加諸如“嗯”之類的口頭習慣和每個句子之間的呼吸聲。

我們仍然沒有完全實現 OpenAI 春季更新中對 ChatGPT 做出的屏幕共享和實時視頻的全部承諾,但它最終會到來,這對於其他語音模型而言,仍然是一次重大的升級。

您在臺式機應用程序中訪問高級語音的方式跟在 iOS 或 Android 中是相同的——點擊聊天欄中的圖標。一旦您點擊這個按鈕,它就會打開一個帶有那個如今衆人皆知的漸變藍色圓圈的新視圖。

您可以在繼續進行其他任務的同時與 AI 交談。雖然它看不到您在幹啥,但它能夠對任務的描述或者您的表現進行響應。因此,例如,如果您在玩《我的世界》時使用它,您可以描述場景,它可以提議使用的建築或方塊類型。

把先進的語音功能帶到桌面是 OpenAI 合乎邏輯的下一步舉措。能夠與人工智能對話,能讓您集思廣益,或者完成您可能獨自無法完成的任務。

未來,您還能跟高級語音共享您的屏幕,好讓它能看到您正在做的事。有一天,隨着人工智能代理的興起,您甚至有可能讓它控制您的屏幕,並且在這個過程中跟您交流。

雖說高級語音是個非常有用的工具,不過更強大的是底層的實時 API。這是開發人員用來構建自己的版本或者把它集成到自己工具中的高級語音後端。

在近期與 OpenAI 團隊的一次情況通報會上,該公司的開發者聯絡負責人羅曼·休特(Romain Huet)展示了這一令人印象深刻的太陽系演示。您能夠指示語音在行星之間移動,它能夠實時就我們所訪問的每個世界的性質提供見解,並以對話的方式回答問題。

在另一場演示中,他展示了把它用作虛擬旅行社,不僅幫助您預訂航班,還能找到最佳交易。您可以向它表明您的明確要求,它能夠依據可用內容進行提問或提供反饋,而不是像我們當下從自動電話中看到的那種邏輯樹方法。

所有這些功能即將開始推出,不僅在 OpenAI 的應用程序中,而且在未來幾個月和幾年中其他開發者的應用程序中。我認爲語音將成爲我們與計算機交互的新方式。

現在我就只需要找一款更好的聽寫軟件,別讓我花上好幾個小時去回顧用語音輸入的所有內容來修正那些明顯的錯誤。