劃重點(diǎn):
- 谷歌發(fā)布了名為 Veo 的生成式 AI 視頻模型,可以創(chuàng)建高質(zhì)量、逼真的1080p 視頻片段。
- Veo 支持文本到視頻、視頻到視頻以及圖像到視頻的轉(zhuǎn)換,能夠應(yīng)用于多種電影風(fēng)格。
- 谷歌與藝術(shù)家 Donald Glover 合作測試 Veo 的新功能,展示出令人驚嘆的視頻生成能力。
站長之家(ChinaZ.com)5月15日 消息:谷歌在其深度學(xué)習(xí) AI 部門 DeepMind 的研究人員發(fā)布了一款名為 Veo 的全新式 AI 視頻模型,能夠創(chuàng)建“超過60秒的高質(zhì)量、1080p 剪輯”,“從照片寫實(shí)主義到超現(xiàn)實(shí)主義和動畫,它可以應(yīng)對一系列電影風(fēng)格”,在逼真度和視覺果方面達(dá)到了令人驚嘆的水平。
Veo 的目標(biāo)是幫助各類用戶創(chuàng)作視頻,不論是經(jīng)驗(yàn)富的電影制片人、有抱負(fù)的創(chuàng)作者,還是渴望分享知識的教育工作者,都可以通過 Veo 實(shí)現(xiàn)的故事敘述方式。
Veo 支持文本到視頻、視頻到視頻以及圖像到視頻的轉(zhuǎn)換,能夠適各電影風(fēng)格,從寫實(shí)主義到超現(xiàn)實(shí)主義和動畫。
谷歌與藝術(shù)家 Donald Glover 合作,通過他的創(chuàng)工作室 Gilga 測試了 Veo 的一些新功能。DeepMind 在 YouTube 和 X 平臺上發(fā)布了一些由 V 生成的視頻和提示,包括霓虹城市、真實(shí)的海洋水母、牛仔騎馬、太空飛船穿越虛空和真的人物場景等。這些視頻幾乎無法與真人拍攝或?qū)I(yè)的計算機(jī)生成動畫區(qū)分開,而且都是由文本提示生成的。
圖片來自谷歌官方用Veo生成視頻截圖
Veo 不僅可以根據(jù)文本提示生成視頻,還可以快速編輯 AI 生成的視頻用戶上傳的片段,甚至是預(yù)先錄制的真人鏡頭。當(dāng)給定一個輸入視頻和編輯命令時,比如在海線的航拍畫面中添加皮劃艇,Veo 可以應(yīng)用這個命令到初始視頻,并創(chuàng)建一個新的編輯后的視頻。此,Veo 還能夠?qū)崿F(xiàn)視頻幀之間的一致性,避免一些奇怪和令人不安的轉(zhuǎn)換瑕疵,這得益于其采用了先進(jìn)的潛在擴(kuò)散變壓器技術(shù),可以減少這些不一致之處使角色、物體和風(fēng)格保持在現(xiàn)實(shí)生活中的位置。
為了提高生成視頻的質(zhì)量,谷歌在練數(shù)據(jù)的每個視頻標(biāo)題中添加了更多細(xì)節(jié),并使用高質(zhì)量、壓縮表示視頻(也稱為潛在變量),從而高了效率。此外,所有的 Veo 視頻都嵌入了 SynthID,即谷歌的內(nèi)容憑證跟蹤數(shù)字水印以確??梢员挥凶R別能力的機(jī)構(gòu)識別為由 AI 生成。
Veo 是 DeepMind 多年研究的結(jié)晶,建在之前的研究成果基礎(chǔ)上,包括生成查詢網(wǎng)絡(luò) (GQN)、DVD-GAN、Imagen-Video、Phenaki、ALT、VideoPoet 和 Lumiere 等。目前,谷歌并沒有公開發(fā)布 Veo,只提供給少數(shù)特定的創(chuàng)作者私人預(yù)覽中使用。未來,谷歌還計劃將 Veo 的部分功能引入 YouTube Shorts 和其他產(chǎn)品中。
(舉報)