人工智慧巨擘 OpenAI 再推新作!名為 Sora 的生成式 AI 新工具,可將文字轉換為影像,拋出一段描述,就能產製一支超擬真影片,再度挑戰真偽界線。
Sora 的威能
根據衛報、CNBC,使用者只需要輸入一段文字、描述一段場景,Sora 就能依指示生成一支高畫質影片。此外,Sora 也能從靜止的畫面生出動態影像,或延長現有的影片、補上缺漏的畫格或鏡頭。
Sora 得名自日文的「天空」,創造的影片最長可達 1 分鐘,風格主題隨你創作。從 OpenAI 在網站與 X 平台釋出的 10 多支示範影片可見,從人物到動物,從陸上風景到海底世界,從表情細緻度到場景的複雜程度,都難不倒 Sora。
其中一例的文字敘述為:
Beautiful, snowy Tokyo city is bustling. The camera moves through the bustling city street, following several people enjoying the beautiful snowy weather and shopping at nearby stalls. Gorgeous sakura petals are flying through the wind along with snowflakes.
譯文:東京在美麗的雪景中一派熙攘。鏡頭在繁華的街道中移動,跟著一群享受這美好雪天、在小攤閒逛著的人們。風吹起了櫻花花瓣,伴隨著雪花朵朵,煞是動人。
17 秒的影片完美演繹了文字敘述,若不細究,還真以為是走在冬季的東京街頭。
Introducing Sora, our text-to-video model.
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) February 15, 2024
Sora 的不足
OpenAI 雖標榜 Sora 能將天馬行空的畫面擬真實現,但尚未優化的初版模型仍有其侷限。如,可能無法模擬太複雜的物理現象,或無法表達「因果關係」。比如,吃了一口餅乾後,下一個畫面可能會出現餅乾並無咬過的痕跡,也就是會出現前後不一致的破綻、穿幫畫面。
有限度開放使用
目前 Sora 僅供一小群研究人員與影像創作者使用,這些「紅隊」(red team)人員將測試 Sora 可能會被濫用的情況,如涉及假資訊或有害的內容,像是暴力、色情、移花接木名人、偏見內容等等。
OpenAI 並稱會研發辨識工具,可偵測影像是否由 Sora 製作,亦將釋出「詮釋資料」(metadata),助使用者辨析影像是天然抑或經過人工處理。
AI 新場域,是機會也帶來疑慮
生成式 AI 的疆域,已從聊天機器人、影像生成,延伸至影片範疇。除了 OpenAI,在此界耕耘的還有 Meta、谷歌(Google)、亞馬遜(Amazon)、Stability AI 等公司。
AI 科技的突破持續令人大開眼界,帶來新的可能性,但事情總有一體兩面。根據機器學習公司 Clarity,AI 深偽影像一年來激增了 900%。隨著 Sora 這類工具的誕生,假作真時真亦假,再一次確認了,眼見不一定為真。