11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務器首年1.8折起,買1年送3個月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享??靵眚v訊云選購吧!
隨著增強現(xiàn)實技術的崛起,研究人員和消費者對結合AR的智能手機應用表現(xiàn)出了日益增長的興趣。這種技術允許用戶實時生成和修改面部特征,用于短視頻、虛擬現(xiàn)實和游戲等應用。這一技術的發(fā)布標志著在設備內部生成模型方面的重要進展,為未來的應用和探索提供了更多可能性。
谷歌最近發(fā)布了MediaPipeDiffusion插件,這是一個可在移動設備上運行的低成本可控文本到圖像生成解決方案。該插件可以提取條件圖像中的特征,并將其注入到擴散模型的編碼器中,以實現(xiàn)對圖像生成過程的控制。這將為移動端應用提供更靈活和定制化的生成式AI能力。
Diffusion模型近年來在文本到圖像生成方面得到廣泛應用,并取得了顯著的成功,從在圖像質量、推理性能和創(chuàng)造性范圍方面實現(xiàn)了重大改進。在難以用文字明確定義的條件下,有效的生成管理仍然是一個挑戰(zhàn)。谷歌希望插件網(wǎng)絡只有600萬個參數(shù),使其成為一個相對簡單的模型。