中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

    <td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>
    <rp id="h1kkc"></rp>
    首頁 > 業(yè)界 > 關(guān)鍵詞  > MotionDirector最新資訊  > 正文

    MotionDirector:AI定制視頻新方法

    2023-10-18 09:28 · 稿源:站長之家

    要點:

    1. 該研究提出了MotionDirector,一種基于人工智能的方法,用于自定義視頻的運動和外觀,通過訓(xùn)練模型學(xué)習(xí)運動和外觀,以生成特定運動的視頻。

    2. MotionDirector采用雙通道架構(gòu),分別學(xué)習(xí)單一或多個參考視頻中的外觀和運動,實現(xiàn)外觀和運動的解耦,并能夠合并不同源視頻的外觀和運動。

    3. 該研究通過對多個基準數(shù)據(jù)進行比較,表明MotionDirector在生成具有多樣性和所需運動概念的視頻方面具有潛力,盡管有一些改進的空間。

    站長之家(ChinaZ.com)10月18日 消息:最新研究指出,文本到視頻傳播模型在最近取得了顯著進展,用戶只需提供文本描述,就可以創(chuàng)建逼真或富有想象力的視頻。這些基礎(chǔ)模型還被調(diào)整以生成與特定外觀、風(fēng)格和主題匹配的圖像。

    然而,在文本到視頻生成中自定義運動的領(lǐng)域仍需要深入探討。用戶可能希望創(chuàng)建具有特定運動的視頻,比如汽車前進然后左轉(zhuǎn)。因此,將擴散模型調(diào)整以創(chuàng)建更具體內(nèi)容以滿足用戶的需求變得非常重要。

    image.png

    項目地址:https://showlab.github.io/MotionDirector/

    為了解決這一問題,研究人員提出了MotionDirector,這是一種雙通道架構(gòu)的人工智能方法,旨在訓(xùn)練模型學(xué)習(xí)給定單個或多個參考視頻中的外觀和運動,使其能夠同時實現(xiàn)運動的自定義和外觀的多樣性。

    其中,空間通道包含了一個基礎(chǔ)模型,其在每個視頻的變換層中集成了可訓(xùn)練的空間LoRAs(低秩適應(yīng)),這些LoRAs是通過在每個訓(xùn)練步驟中隨機選擇的單幀來進行訓(xùn)練,以捕捉輸入視頻的視覺屬性。與此相反,時間通道復(fù)制了基礎(chǔ)模型,與空間通道共享空間LoRAs,以適應(yīng)給定輸入視頻的外觀。此外,時間通道中的時間變換器還使用從輸入視頻中選擇的多幀進行訓(xùn)練,以捕捉固有的運動模式。

    通過部署經(jīng)過訓(xùn)練的時間LoRAs,基礎(chǔ)模型可以合成具有多樣外觀的學(xué)習(xí)運動的視頻。這種雙通道架構(gòu)使模型能夠分別學(xué)習(xí)視頻中物體的外觀和運動,從而使MotionDirector能夠隔離視頻的外觀和運動,然后從不同的源視頻中進行組合。

    研究人員通過在多個基準數(shù)據(jù)上比較MotionDirector的性能,包括80多種不同的運動和600個文本提示。在UCF體育動作基準測試中,MotionDirector被人工評定者約75%的時間選擇,以獲得更好的運動保真度,該方法還勝過了25%的基準模型的首選項。

    在第二個基準測試中,即LOVEU-TGVE-2023基準測試中,MotionDirector表現(xiàn)優(yōu)于其他可控生成和調(diào)整方法。這些結(jié)果表明,MotionDirector可以定制多個基礎(chǔ)模型,以生成具有多樣性和所需運動概念的視頻。

    總之,MotionDirector是一種有潛力的新方法,可用于調(diào)整文本到視頻傳播模型,以生成具有特定運動的視頻。它在學(xué)習(xí)和適應(yīng)物體和攝像機的特定運動方面表現(xiàn)出色,并可以用于生成具有各種視覺風(fēng)格的視頻。

    盡管在學(xué)習(xí)參考視頻中多個主體的運動方面仍有改進空間,但即便存在這些限制,MotionDirector仍有潛力增強視頻生成的靈活性,使用戶能夠制作符合其需求的定制視頻。

    舉報

    • 相關(guān)推薦
    • MCP協(xié)議和Function Calling 、 AI Agents的區(qū)別是什么?MCP優(yōu)勢有哪些

      MCP、FunctionCalling和AIAgents是三種重要的技術(shù)手段,它們在實現(xiàn)AI模型與外部系統(tǒng)交互方面各有特點。本文將詳細對比這三種技術(shù),并深入探討MCP的多項顯著優(yōu)勢。隨著MCP技術(shù)的不斷發(fā)展,我們有理由相信,它將在未來的AI領(lǐng)域發(fā)揮越來越重要的作用。

    • Windows Arm64 托管運行器正式支持 GitHub Actions,加速開發(fā)流程

      Arm與GitHub深化合作,為Arm平臺開發(fā)者提供更高效的開發(fā)體驗。

    • 追覓全球首創(chuàng)20萬轉(zhuǎn)高速數(shù)字馬達量產(chǎn)落地!吸塵器Z50 Station突破行業(yè)天花板

      在吸塵器行業(yè)持續(xù)突破性能極限的進程中,追覓科技以突破性創(chuàng)新技術(shù)再次領(lǐng)跑賽道。2024年,追覓科技自研的20萬轉(zhuǎn)/分鐘高速數(shù)字馬達獲全球權(quán)威機構(gòu)沙利文全球首創(chuàng)認證。追覓科技將以創(chuàng)新為引擎,持續(xù)引領(lǐng)全球清潔電器行業(yè)邁向智能化、高效化的新時代。

    • 聯(lián)想moto edge 60系列官宣:超薄AI影像手機 5月登場

      聯(lián)想宣布,聯(lián)想motoedge60系列將于5月登場,這是一款至美超薄AI影像手機,采用流光四曲面設(shè)計,帶來愛不釋手的絕佳手感。聯(lián)想motoedge60系列已經(jīng)獲得入網(wǎng)許可,包含motoedge60、motoedge60Pro和motoedge60Fusion三款機型。博主數(shù)碼閑聊站表示,聯(lián)想今年的產(chǎn)品序列會有所調(diào)整,海外edge系列會重回國內(nèi)市場,主打輕薄時尚和拍照,同時razr系列折疊屏也會在近期推出,razr和edge會有很罕見的新材質(zhì)和定制款,聯(lián)想今年的新品規(guī)模很大。

    • 雙向免疫調(diào)節(jié)助力兒童健康未來,京生·脾氨肽口服溶液為兒童過敏性鼻炎與腺樣體肥大診療提供新方法

      復(fù)旦大學(xué)附屬兒科醫(yī)院許政敏教授團隊發(fā)布《兒童腺樣體肥大臨床診療管理專家共識》,指出我國34.4%兒童患有腺樣體肥大。該病常與過敏性鼻炎并發(fā),傳統(tǒng)治療存在創(chuàng)傷風(fēng)險。共識推薦采用雙向免疫調(diào)節(jié)劑"京生·脾氨肽口服溶液"新療法,通過調(diào)節(jié)免疫平衡,8周內(nèi)可顯著縮小腺樣體并改善鼻塞等癥狀,且安全性良好。該方案為兒童過敏性鼻炎合并腺樣體肥大提供了更安全有效的治療選擇。

    • AI日報:ChatGPT重磅上線圖像庫功能;白嫖!Veo2登陸谷歌AI Studio;螞蟻百寶箱推“MCP專區(qū)”

      歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、報道稱字節(jié)跳動整合 AI 研發(fā)團隊,AI Lab 即將并入 Seed字節(jié)跳動正在進行AI研發(fā)團隊的整合,將獨立的字節(jié)AI Lab并入Seed團隊。這一舉措體現(xiàn)了字節(jié)在AI領(lǐng)域戰(zhàn)略布局的調(diào)整,旨在進?

    • AI測試市場深度分析:Testin XAgent如何引領(lǐng)企業(yè)測試流程的智能化變革?

      隨著人工智能技術(shù)的飛速發(fā)展,軟件測試行業(yè)正經(jīng)歷著一場前所未有的變革。傳統(tǒng)的人工測試方式已無法滿足企業(yè)對測試效率和質(zhì)量的更高要求。Testin云測將繼續(xù)加大在AI測試領(lǐng)域的投入,不斷推出更智能、更高效的測試解決方案,助力企業(yè)實現(xiàn)數(shù)字化轉(zhuǎn)型,構(gòu)建高質(zhì)量的軟件交付體系。

    • 聚焦“AI+運動康復(fù)”,iRest艾力斯特引領(lǐng)運動健康科學(xué)新紀元

      2025年3月21日,iRest艾力斯特在溫州召開"AI+康復(fù)與產(chǎn)學(xué)研融合創(chuàng)新高峰論壇暨經(jīng)銷商大會"。大會聚焦"科技賦能健康"主題,匯聚全球頂尖專家探討AI技術(shù)與運動康復(fù)的深度融合,發(fā)布多項創(chuàng)新成果與未來戰(zhàn)略規(guī)劃。公司通過AI技術(shù)構(gòu)建智能康復(fù)體系,推出搭載多模態(tài)監(jiān)測系統(tǒng)的高端產(chǎn)品,并與多所高校共建研發(fā)中心。近年來,艾力斯特持續(xù)深耕運動健康領(lǐng)域,簽約?

    • 累了倦了就找 ChatGPT……AI正在淪為“情緒垃圾桶”!

      向 AI 傾訴情感在短期內(nèi)可能會帶來安慰,但過度依賴則存在風(fēng)險。通過即時的回應(yīng)可以獲得暫時的穩(wěn)定感,但從長遠來看,這會讓人失去培養(yǎng)情緒調(diào)節(jié)能力和解決問題能力的機會……

    • 聯(lián)想moto razr 60系列官宣:首發(fā)星海電池2.0 能量密度刷新紀錄

      聯(lián)想將于5月8日在上海發(fā)布moto razr 60系列折疊屏手機。該系列首發(fā)星海電池2.0,能量密度達860Wh/L創(chuàng)行業(yè)新高,搭載前后5000萬AI三攝系統(tǒng),號稱"小折疊最強影像"。新機內(nèi)置AI私人格調(diào)影像系統(tǒng),支持一鍵變換照片風(fēng)格,并提供素皮、玻璃、木材等多種后蓋材質(zhì)選擇。核心配置上,razr 60系列全球首發(fā)驍龍8至尊版移動平臺,Geekbench跑分單核2878、多核8840,配備16GB內(nèi)存并預(yù)裝Android 15系統(tǒng),堪稱當(dāng)前性能最強的小折疊手機。