☰

OpenAI測試文本轉影片模型Sora 開放部分用戶嘗鮮

OpenAI執行長阿特曼。路透社

創造聊天機器人ChatGPT和圖像生成器DALL-E的科技公司OpenAI表示，公司正在測試一款由文本轉爲影片的模型Sora，能讓用戶透過簡單的指令創造出逼真的影片。

法新社報導，這間獲微軟（Microsoft）支持的公司指出，這個新平臺目前正在進行測試，不過釋出了幾段OpenAI稱已經可行的影片，附上生成影片的文字輸入指令。

OpenAI在部落格貼文中表示：「Sora能生成長達1分鐘的影片，同時維持視覺品質，並符合用戶的指令。」

OpenAI還說，這款模型也能從既有的靜態圖片生成影片。

OpenAI執行長阿特曼（Sam Altman）在社羣媒體X上表示，公司在測試階段「向數量有限的創作者提供存取權限」。

他也邀請用戶在X上提出指令建議，幾分鐘後在這個平臺上張貼頗具說服力的影片生成結果，其中包括兩隻黃金獵犬在山上開串流Podcast、老奶奶在廚房教烹飪、動物在海上騎腳踏車，以及珠光寶氣的動物園等。

還有另一支影片顯示「半鴨半龍的生物飛馳在美麗的暮色中，背上騎着一隻身着探險裝備的倉鼠」。

不過這間總部位於舊金山的新創公司警告說，「目前的模型存有弱點」，像是左右不分，或未能在整段影片中維持視覺連貫性。

OpenAI聲明指出，安全性會是一大關鍵，還說Sora會面臨對抗性資安測試，也就是所謂的紅隊演練（red-teaming），期間特定用戶會試圖讓平臺失靈，產生不恰當的內容或出毛病。

OpenAI指出：「我們會接洽全球政策制定者、教育家和藝術家，以瞭解他們的顧慮，並找出這種新技術的正面使用案例。」

臉書母公司Meta、谷歌（Google）和Runway AI也在研發文本轉文影片人工智慧（AI）技術，已經公佈類似的工作樣本。

相關資訊