要點(diǎn):
1. 谷歌研究團(tuán)隊(duì)提出了一種名為UFOGen的擴(kuò)散模型變種,只需要一步就能生成高質(zhì)量的圖片。
2. UFOGen通過(guò)改變生成器的參數(shù)化方式和重構(gòu)損失函數(shù)的計(jì)算方式,理論上可以實(shí)現(xiàn)一步生成。
3. UFOGen的生成器和判別器都是由Stable Diffusion模型初始化,這樣可以最大限度地利用Stable Diffusion的內(nèi)部信息。
站長(zhǎng)之家(ChinaZ.com)11月20日 消息:近年來(lái),擴(kuò)散模型在視覺(jué)創(chuàng)作領(lǐng)域的應(yīng)用不斷增加,但是生成速度一直是一個(gè)問(wèn)題。然而,隨著技術(shù)的進(jìn)步,UFOGen模型的出現(xiàn)解決了這個(gè)問(wèn)題,它只需要一步就能生成高質(zhì)量的圖片。通過(guò)改變生成器的參數(shù)化方式和重構(gòu)損失函數(shù)的計(jì)算方式,UFOGen實(shí)現(xiàn)了一步生成的目標(biāo)。
論文地址:https://arxiv.org/pdf/2311.09257.pdf
之前對(duì)擴(kuò)散模型生成速度的研究主要集中在兩個(gè)方向,一方面是利用更少的離散步數(shù)求解擴(kuò)散模型的采樣ODE,另一方面是利用知識(shí)蒸餾的方法將采樣路徑壓縮到更小的步數(shù)。然而,谷歌的研究團(tuán)隊(duì)在UFOGen模型中采用了一種全新的思路,通過(guò)改變生成器的參數(shù)化方式和重構(gòu)損失函數(shù)的計(jì)算方式來(lái)實(shí)現(xiàn)一步生成的目標(biāo)。
UFOGen模型是在擴(kuò)散模型和GAN混合模型的基礎(chǔ)上發(fā)展而來(lái)的。擴(kuò)散模型假設(shè)降噪分布是一個(gè)簡(jiǎn)單的高斯分布,但這種假設(shè)只在降噪步長(zhǎng)趨于0時(shí)成立,導(dǎo)致生成速度很慢。而UFOGen模型通過(guò)使用帶條件的GAN來(lái)模擬降噪分布,取較大的降噪步長(zhǎng)來(lái)減少步數(shù),從而提高了生成速度。
(舉報(bào))