OpenAI測試文本轉影片模型Sora 開放部分用戶嘗鮮
OpenAI執行長阿特曼。 路透社
創造聊天機器人ChatGPT和圖像生成器DALL-E的科技公司OpenAI表示,公司正在測試一款由文本轉爲影片的模型Sora,能讓用戶透過簡單的指令創造出逼真的影片。
法新社報導,這間獲微軟(Microsoft)支持的公司指出,這個新平臺目前正在進行測試,不過釋出了幾段OpenAI稱已經可行的影片,附上生成影片的文字輸入指令。
OpenAI在部落格貼文中表示:「Sora能生成長達1分鐘的影片,同時維持視覺品質,並符合用戶的指令。」
OpenAI還說,這款模型也能從既有的靜態圖片生成影片。
OpenAI執行長阿特曼(Sam Altman)在社羣媒體X上表示,公司在測試階段「向數量有限的創作者提供存取權限」。
他也邀請用戶在X上提出指令建議,幾分鐘後在這個平臺上張貼頗具說服力的影片生成結果,其中包括兩隻黃金獵犬在山上開串流Podcast、老奶奶在廚房教烹飪、動物在海上騎腳踏車,以及珠光寶氣的動物園等。
還有另一支影片顯示「半鴨半龍的生物飛馳在美麗的暮色中,背上騎着一隻身着探險裝備的倉鼠」。
不過這間總部位於舊金山的新創公司警告說,「目前的模型存有弱點」,像是左右不分,或未能在整段影片中維持視覺連貫性。
OpenAI聲明指出,安全性會是一大關鍵,還說Sora會面臨對抗性資安測試,也就是所謂的紅隊演練(red-teaming),期間特定用戶會試圖讓平臺失靈,產生不恰當的內容或出毛病。
OpenAI指出:「我們會接洽全球政策制定者、教育家和藝術家,以瞭解他們的顧慮,並找出這種新技術的正面使用案例。」
臉書母公司Meta、谷歌(Google)和Runway AI也在研發文本轉文影片人工智慧(AI)技術,已經公佈類似的工作樣本。