站長(zhǎng)之家(ChinaZ.com)3月4日 消息:ComfyUI的LayerDiffusion透明圖層生成插件也已經(jīng)發(fā)布了,目前還只支持生成。該插件主要包含兩個(gè)節(jié)點(diǎn),其中一個(gè)遮罩節(jié)點(diǎn)需要安裝comfyui-tooling-nodes插件。
LayerDiffusion項(xiàng)目已經(jīng)在forge的擴(kuò)展上可以使用,經(jīng)過(guò)測(cè)試,其功能強(qiáng)大,不僅支持直接生成透明的圖片元素,還可以在已有圖片上生成與環(huán)境融合的透明圖片。
LayerDiffusion利用大型預(yù)訓(xùn)練的潛在擴(kuò)散模型(latent diffusion model)來(lái)創(chuàng)造透明圖像。這項(xiàng)技術(shù)不僅可以生成單獨(dú)的透明圖像,還能生成多層透明圖層。它通過(guò)一種被稱為“潛在透明度”的方法,將透明度(即 alpha 通道)整合到預(yù)訓(xùn)練的潛在擴(kuò)散模型的潛在結(jié)構(gòu)中。
項(xiàng)目地址:https://top.aibase.com/tool/comfyui-layerdiffusion
這樣做的好處是,它通過(guò)以潛在偏移的形式加入透明度,幾乎不改變模型原有的潛在分布,從而保持了模型的高質(zhì)量輸出能力?;谶@種方法,任何一個(gè)潛在擴(kuò)散模型都可以通過(guò)對(duì)潛在空間的微調(diào),轉(zhuǎn)化為透明圖像生成器。
在訓(xùn)練這個(gè)模型時(shí),我們使用了一種涉及人機(jī)互動(dòng)的方法,收集了一百萬(wàn)組透明圖像層數(shù)據(jù)。研究顯示,這種潛在透明技術(shù)不僅可以應(yīng)用于不同的開(kāi)源圖像生成器,還可以適配多種條件控制系統(tǒng),實(shí)現(xiàn)例如基于前景/背景條件的層生成、層的聯(lián)合生成、對(duì)層內(nèi)容進(jìn)行結(jié)構(gòu)控制等多種應(yīng)用。
一項(xiàng)用戶研究發(fā)現(xiàn),大多數(shù)情況下(97%),相比于之前的臨時(shí)解決方案(如先生成圖像再進(jìn)行摳圖處理),用戶更喜歡直接生成的透明內(nèi)容。使用LayerDiffusion生成的透明圖像在質(zhì)量上可媲美真實(shí)的商業(yè)級(jí)透明素材,例如 Adobe Stock 提供的素材。
(舉報(bào))