中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

    <td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>
    <rp id="h1kkc"></rp>
    首頁(yè) > 業(yè)界 > 關(guān)鍵詞  > DiffPortrait3D最新資訊  > 正文

    AI模型DiffPortrait3D:一張肖像圖就能創(chuàng)造各種逼真表情3D表情

    2023-12-28 14:29 · 稿源:站長(zhǎng)之家

    # 劃重點(diǎn)

    1. ?? DiffPortrait3D是字節(jié)跳動(dòng)團(tuán)隊(duì)研發(fā)的一種條件擴(kuò)散模型,可從一張野外拍攝的肖像中創(chuàng)建逼真的、3D一致的視圖。

    2. ?? 該模型通過(guò)零樣本能力,能夠從單一的肖像生成多樣的面部視圖,包括不定姿態(tài)、夸張表情和各種藝術(shù)風(fēng)格,無(wú)需繁瑣的優(yōu)化或微調(diào)。

    3. ?? DiffPortrait3D采用了2D擴(kuò)散模型的生成先驗(yàn),結(jié)合特殊的條件控制模塊、交叉視圖注意力模塊和3D感知噪聲生成機(jī)制,實(shí)現(xiàn)了在多視角和野外場(chǎng)景下的高質(zhì)量、真實(shí)感的3D人像合成。

    站長(zhǎng)之家(ChinaZ.com)12月28日 消息:近期,大型語(yǔ)言模型(LLMs)在人工智能社區(qū)引起了轟動(dòng),歸功于其出色的能力和性能。這些模型在幾乎所有基于AI子領(lǐng)域的行業(yè)中展現(xiàn)出了非凡的應(yīng)用,包括自然語(yǔ)言處理、自然語(yǔ)言生成和計(jì)算機(jī)視覺(jué)。盡管計(jì)算機(jī)視覺(jué),尤其是擴(kuò)散模型引起了極大關(guān)注,但仍然存在使用有限輸入生成高保真、連貫新視角的挑戰(zhàn)。

    為了應(yīng)對(duì)這一挑戰(zhàn),字節(jié)跳動(dòng)的研究團(tuán)隊(duì)最近推出了DiffPortrait3D,這是一種獨(dú)特的條件擴(kuò)散模型,旨在從一張野外拍攝的肖像中創(chuàng)建逼真的、3D一致的視圖。DiffPortrait3D可以將一張二維(2D)非受限制的肖像重建為人臉的三維(3D)表示。

    image.png

    簡(jiǎn)單來(lái)說(shuō),給定一張彩色照片作為輸入,該項(xiàng)目的目標(biāo)是合成具有保持身份和面部表情的合理但一致的面部細(xì)節(jié),以新的相機(jī)視角呈現(xiàn)出來(lái)。與耗時(shí)的優(yōu)化和微調(diào)不同,這種零樣本方法能夠很好地推廣到具有不規(guī)定相機(jī)視角、極端面部表情和多樣藝術(shù)描繪的任意人臉肖像。其核心思想是利用在大規(guī)模圖像數(shù)據(jù)集上預(yù)訓(xùn)練的2D擴(kuò)散模型作為渲染骨架,同時(shí)使用解耦的關(guān)注控制外觀和相機(jī)姿勢(shì)的去噪引導(dǎo)。

    為了實(shí)現(xiàn)這一點(diǎn),首先將參考圖像的外觀上下文注入到凍結(jié)的UNets的自注意層中。然后,使用一個(gè)新穎的條件控制模塊來(lái)解釋相機(jī)姿勢(shì),該模塊通過(guò)觀察來(lái)自相同視角的一個(gè)交叉主體的條件圖像。此外,研究人員插入一個(gè)可訓(xùn)練的跨視圖注意模塊來(lái)增強(qiáng)視圖一致性,這進(jìn)一步通過(guò)推斷期間的新穎3D感知噪聲生成過(guò)程得以加強(qiáng)。

    DiffPortrait3D使用特殊的條件控制模塊來(lái)改變渲染視圖。該模塊分析從相同角度拍攝的主體的條件圖像,以解釋相機(jī)的態(tài)度。這使得模型能夠從不同視角結(jié)合一致的面部特征。

    為了進(jìn)一步提高視覺(jué)一致性,還引入了一個(gè)可訓(xùn)練的交叉視圖注意力模塊。在面對(duì)嚴(yán)重的面部表情或不定姿態(tài)的相機(jī)視角可能導(dǎo)致困難的情況下,這個(gè)模塊尤其有幫助。

    為了確保推理過(guò)程的彈性,還包括了一種獨(dú)特的3D感知噪聲生成機(jī)制。這一階段增加了合成圖像的整體穩(wěn)定性和逼真感。團(tuán)隊(duì)在嚴(yán)格的多視角和野外基準(zhǔn)測(cè)試上評(píng)估了DiffPortrait3D的性能,展示了在各種藝術(shù)風(fēng)格和環(huán)境設(shè)置下產(chǎn)生逼真高質(zhì)量面部重建的最新成果。

    該技術(shù)主要特點(diǎn)包括:

    1. 引入了一種獨(dú)特的零樣本方法,通過(guò)擴(kuò)展2D穩(wěn)定擴(kuò)散,從單一肖像創(chuàng)建3D一致的新視圖。

    2. 該方法在獨(dú)特視圖合成方面取得了令人印象深刻的成就,支持外觀、表情、態(tài)度和風(fēng)格各異的肖像,無(wú)需繁瑣的微調(diào)。

    3. 使用明確分離的外觀和相機(jī)視圖控制系統(tǒng),實(shí)現(xiàn)了有效的相機(jī)操作,而不影響主體的表情或身份。

    4. 該方法結(jié)合了交叉視圖注意力模塊和3D感知噪聲生成技術(shù),提供了3D視圖的長(zhǎng)程一致性。

    項(xiàng)目網(wǎng)址體驗(yàn):https://top.aibase.com/tool/diffportrait3d

    論文網(wǎng)址:https://arxiv.org/abs/2312.13016

    舉報(bào)

    • 相關(guān)推薦
    • 盧偉冰回應(yīng)雷軍近況:一個(gè)愛(ài)心表情

      有網(wǎng)友在小米集團(tuán)盧偉冰評(píng)論區(qū)提問(wèn):雷軍最近還好嗎?盧偉冰回復(fù)了一個(gè)愛(ài)心的表情。目前官方調(diào)查仍在進(jìn)行中,后續(xù)會(huì)公布調(diào)查結(jié)果。

    • 日銷破千元!AI生成的3D掛件,被我們賣爆了

      先說(shuō)結(jié)論:我們花15天做的AI3D掛件,在線下賣爆了,單日營(yíng)收破千元!故事的開(kāi)始,是因?yàn)槲覀儼l(fā)現(xiàn)把AI3D打印手辦做成一門小生意的可行性越來(lái)越高,這也激發(fā)了我們的“搞錢基因”。再加上前不久新榜在上海舉辦了「新榜內(nèi)容節(jié)」,一拍即合,我們于是做了一批模型去大會(huì)現(xiàn)場(chǎng)擺攤試水!最后結(jié)果還不錯(cuò),單日最高收入突破1000元,是我們“創(chuàng)業(yè)史”上的一個(gè)高光表現(xiàn)。歡迎大家

    • 10倍精度升級(jí)!騰訊混元3D模型v2.5版本發(fā)布

      騰訊混元3D模型升級(jí)至v2.5版本,建模精度和貼圖真實(shí)度顯著提升。新版本參數(shù)體量從1B增至10B,有效面片數(shù)增加超10倍,支持1024幾何分辨率。紋理系統(tǒng)支持4K高清貼圖和凹凸細(xì)節(jié),率先支持多視圖生成PBR模型。針對(duì)動(dòng)畫場(chǎng)景優(yōu)化骨骼蒙皮系統(tǒng),支持非標(biāo)準(zhǔn)姿態(tài)自動(dòng)綁定。新增文生/圖生3D減面模型、多視圖建模模板等專業(yè)工作流?;煸?D v2.5已全面更新至騰訊AI創(chuàng)作引擎,免費(fèi)生成額度提升至每日20次,并正式上線騰訊云API面向企業(yè)開(kāi)放。GitHub開(kāi)源版本累計(jì)Star超1.2萬(wàn)。

    • AI日?qǐng)?bào):騰訊混元3D生成模型2.5版本發(fā)布;海螺推出像人物參考功能;百度上線移動(dòng)端超級(jí)智能體心響App

      本文介紹了多款A(yù)I領(lǐng)域的新產(chǎn)品和技術(shù)進(jìn)展:1)Kortix-AI推出開(kāi)源通用AI智能體平臺(tái)Suna;2)騰訊混元3D生成模型升級(jí)至2.5版本;3)海螺AI推出基于單張圖像生成多角度角色圖像功能;4)百度發(fā)布"心響"App整合多智能體協(xié)作;5)Nari Labs開(kāi)源媲美真人的對(duì)話語(yǔ)音模型Dia;6)Grok新增視覺(jué)處理和多語(yǔ)言支持;7)Genspark推出AI幻燈片工具;8)Character.AI發(fā)布讓靜態(tài)圖片"說(shuō)話"的AvatarFX模型;9)pad.ws結(jié)合白板和代碼編輯器;10)OpenBMB開(kāi)源社區(qū)推出長(zhǎng)文本生成模型"卷姬";11)騰訊推出AI閱讀助手"企鵝讀伴";12)OpenAI有意收購(gòu)Chrome瀏覽器;13)字節(jié)跳動(dòng)調(diào)整AI產(chǎn)品線布局。這些創(chuàng)新展現(xiàn)了AI技術(shù)在自動(dòng)化、3D生成、語(yǔ)音交互、內(nèi)容創(chuàng)作等領(lǐng)域的快速發(fā)展。

    • AI日?qǐng)?bào):Kimi全新音頻基礎(chǔ)模型Kimi-Audio;階躍星辰開(kāi)源像編輯模型Step1X-Edit;?夸克AI超級(jí)框上線 “拍照問(wèn)夸克”

      本期AI日?qǐng)?bào)聚焦多項(xiàng)AI技術(shù)突破與應(yīng)用:1)Moonshot AI推出開(kāi)源音頻模型Kimi-Audio,基于13億小時(shí)訓(xùn)練數(shù)據(jù),支持語(yǔ)音識(shí)別等任務(wù);2)階躍星辰開(kāi)源圖像編輯模型Step1X-Edit,展現(xiàn)強(qiáng)大生成能力;3)夸克AI上線"拍照問(wèn)夸克"功能,實(shí)現(xiàn)視覺(jué)問(wèn)答;4)蘋果iOS18.5將在中國(guó)推送,帶來(lái)智能功能;5)谷歌發(fā)布601個(gè)生成式AI應(yīng)用案例,覆蓋多行業(yè);6)微軟推出深度整合Windows的UFO2自動(dòng)化系統(tǒng);7)OpenAI升級(jí)ChatGPT至GPT-4o版本,提升STEM領(lǐng)域能力;8)Ema公司推出高性價(jià)比語(yǔ)言模型EmaFusion;9)Liquid AI發(fā)布面向邊緣設(shè)備的Hyena Edge模型;10)LemonAI推出實(shí)時(shí)音視頻數(shù)字人產(chǎn)品Slice Live。此外,國(guó)內(nèi)方面,智譜與生數(shù)科技達(dá)成戰(zhàn)略合作推動(dòng)大模型發(fā)展,寶馬中國(guó)宣布新車將接入DeepSeek技術(shù)。

    • Trae國(guó)內(nèi)版怎么用?Trae IDE 內(nèi)置 MCP 市場(chǎng)配置使用指南

      字節(jié)跳動(dòng)旗下Trae+IDE發(fā)布新版本,通過(guò)MCP協(xié)議實(shí)現(xiàn)AI智能體與外部工具的深度集成。MCP作為標(biāo)準(zhǔn)化橋梁,讓開(kāi)發(fā)者能靈活接入Supabase、FireCrawl等第三方服務(wù),只需@符號(hào)即可調(diào)用智能體完成數(shù)據(jù)庫(kù)操作、文檔搜索等復(fù)雜任務(wù)。新版本內(nèi)置MCP市場(chǎng),支持Token快速配置,并演示了如何通過(guò)Figma+AI自動(dòng)生成前端代碼。該技術(shù)可應(yīng)用于Blender建模、K8s管理等多元場(chǎng)景,顯著提升開(kāi)發(fā)效率。Trae+IDE將持續(xù)擴(kuò)展工具生態(tài),推動(dòng)AI協(xié)作開(kāi)發(fā)新時(shí)代。

    • ?上海毅速推出第三代模具3D打印專機(jī)E3系列,引領(lǐng)模具制造技術(shù)革新

      導(dǎo)讀:近年來(lái),金屬3D打印技術(shù)在模具制造領(lǐng)域得到了廣泛的應(yīng)用,模具行業(yè)正在迎來(lái)一場(chǎng)前所未有的技術(shù)變革,隨著應(yīng)用的逐漸深入,模具專用的金屬3D打印機(jī)應(yīng)運(yùn)而生。2025 年 4 月 15 日,上海毅速激光科技有限公司(以下簡(jiǎn)稱“毅速”)正式發(fā)布了其第三代模具3D打印專機(jī)系列——E3- 420 和E3-520。這一新品的推出,標(biāo)志著模具制造行業(yè)向增材制造邁出了重要一步。毅速E3- 420 ?

    • 聚首華南,2025下半年增材制造、3D 打印的頂尖展覽與活動(dòng)推薦

      2025年全球3D打印行業(yè)將迎來(lái)系列盛會(huì)。4月西安論壇成功舉辦后,下半年將迎來(lái)深圳Formnext Asia(8月26-28日)、東京論壇(9月25-26日)和法蘭克福Formnext展會(huì)(11月18-21日)三大國(guó)際活動(dòng)。這些平臺(tái)將匯聚全球頂尖企業(yè),展示航空航天、醫(yī)療健康、汽車工業(yè)等領(lǐng)域的最新技術(shù)成果,特別關(guān)注中國(guó)企業(yè)的快速成長(zhǎng)。法蘭克福展會(huì)預(yù)計(jì)吸引超900家展商,中國(guó)展商數(shù)量有望再創(chuàng)新高。系列活動(dòng)將搭建全球產(chǎn)業(yè)交流平臺(tái),推動(dòng)3D打印技術(shù)創(chuàng)新與商業(yè)應(yīng)用深度融合。

    • OPPO Find X8 Ultra堪稱電子阿膠:拍照直出氣血感

      今日晚間,OPPOFindX8Ultra正式亮相。該機(jī)帶來(lái)全新夜神五攝影像系統(tǒng),包括5000萬(wàn)超廣角、5000萬(wàn)1英寸LYT900主攝、5000萬(wàn)像素3X鏡頭、5000萬(wàn)像素6X望遠(yuǎn)鏡頭以及丹霞原彩鏡頭,同時(shí)配備OPPO超晶態(tài)藍(lán)玻璃,配合分區(qū)色溫感知技術(shù)和多模態(tài)協(xié)同計(jì)算技術(shù),一次性解決夜景人像細(xì)節(jié)糊、色彩偏、膚色怪的三大難題。根據(jù)官方實(shí)拍的對(duì)比樣張,F(xiàn)indX8Ultra能準(zhǔn)確還原人臉的膚色以及人像背后的環(huán)境,然后分別處理,讓人像看上去更有氣血感”,相比之下,iPhone16ProMax的人像樣張?jiān)朦c(diǎn)較多,膚色質(zhì)感跟OPPO有明顯差距。

    • Trae重磅升級(jí):全面開(kāi)放自定義AI能力,用戶可打造個(gè)人專屬“AI 工程師”

      Trae新版本通過(guò)整合AI技術(shù),提供更智能、高效的開(kāi)發(fā)體驗(yàn),支持多語(yǔ)言文件輸入與多種功能擴(kuò)展。它突破傳統(tǒng)IDE模式,強(qiáng)調(diào)人機(jī)協(xié)作與個(gè)性化定制,實(shí)現(xiàn)需求快速轉(zhuǎn)化和技術(shù)方案優(yōu)化。同時(shí),其開(kāi)放的插件系統(tǒng)和自定義能力,滿足不同場(chǎng)景的專業(yè)開(kāi)發(fā)需求,推動(dòng)AI在編程領(lǐng)域的深度融合與創(chuàng)新應(yīng)用。