OpenAI 最新文字轉短片 AI 模型 Sora,一句子生成 60 秒超擬真畫面
目前正評估不當使用的風險,此前不會開放公眾使用。
在文字生成內容、圖片之後,OpenAI 的最新產品 Sora 是讓使用者用文字生成最長 60 秒的高品質影片,他們目前只有開放給少量學者、研究人員使用,評估這 AI 模型被不當使用的風險,在有結論之前不會開放公眾使用。所以我們一般人們就只好先看看 OpenAI 拿出來的示範內容。
Introducing Sora, our text-to-video model.
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf— OpenAI (@OpenAI) February 15, 2024
據 OpenAI 的說法,Sora 不但能夠理解生成提示,還會知道物件在真實世界存在的規則,藉此生成在複雜場景之中,多位角色分別進行的活動,而且會有準備的細節和背景。其中一個示範就是要 Sora 生成一個「美麗的東京雪景、相機隨街道移動、人們在飄雪和櫻花之下的小店街走路。」,另一個示範是讓巨大的長毛象在雪地上奔跑,同時有太陽日照、風吹等天氣狀況。
Prompt: “Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance… pic.twitter.com/Um5CWI18nS
— OpenAI (@OpenAI) February 15, 2024
OpenAI 指 Sora 的生成結果是代表他們的模型能「深度理解語言」,才能如此準確地演繹文字提示。然而在官網上的一些生成例子也蠻微妙的,像是其中一個是要生成斑點狗在意大利小屋的窗邊走過,同時要有很多行人和單車經過小屋前面。但生成影片就只有句子的前半段,後半就完全無視了。
說到文字生成影片的 AI 模型,Meta、Google、Runway 等都其實也有,甚至有提供公眾使用,不過 Open AI 的 Sora 是目前唯一能生成 60 秒長的內容,而且是整段影片一口氣生成,而非像其他模型般逐格生成再連續播放。
隨著 AI 生成技術的進步,人類社會因此也面對更多種不同的危機,就像早前香港的一宗騙案,正是以 Deepfake 來生成視訊會議畫面,成功騙過員工並取得大額金錢。其他的名人換臉影片也非常常見,使得假資訊更防不勝防。
更多文章:
騙徒靠 deepfake 假扮跨國公司 CFO,致使香港分部職員上當損失 2 億港幣
Yahoo Tech 隨筆| 極度擬真的人形 AI 形象,是恐怖谷?還是社會危機的解答?
Yahoo Tech 隨筆|AI 音訊的下一步:讓喜愛的歌手讀出客戶訊息
Yahoo Tech 隨筆:讓 AI 讀懂中國古書,會生成什麼樣的圖像呢?
緊貼最新科技資訊、網購優惠,追隨 Yahoo Tech 各大社交平台!
🎉📱 Tech Facebook:https://www.facebook.com/yahootechhk
🎉📱 Tech Instagram:https://www.instagram.com/yahootechhk/
🎉📱 Tech WhatsApp 社群:https://chat.whatsapp.com/Dg3fiiyYf3yG2mgts4Mii8
🎉📱 Tech WhatsApp 頻道:https://whatsapp.com/channel/0029Va91dmR545urVCpQwq2D