劃重點:
?? 研究人員利用強化學習訓練 AI 代理人自主創(chuàng)建真正的拼貼藝術品
?? 強化學習模型通過與畫布互動來學習拼貼藝術品的創(chuàng)作過程
?? 該方法通過用戶研究和基于 CLIP 的評估證明了其在 AI 生成的藝術方面的出色性能
韓國首爾國立大學的研究人員致力于訓練能夠自主創(chuàng)作真正拼貼藝術品的 AI 代理人。目前市面上的 AI 工具(如 DALL-E 和 StableDiffusion)可以生成類似拼貼的圖像,但缺乏真正的創(chuàng)作過程的真實性。
為了克服這一挑戰(zhàn),研究人員引入了一種開創(chuàng)性的方法,利用強化學習(RL)來訓練 AI 代理人創(chuàng)作 “真正的拼貼藝術品”。與基于像素的方法不同,該方法涉及撕裂和粘貼材料,以復制著名藝術品和其他圖像的步驟。研究人員擺脫了現(xiàn)有工具的限制,通過強化學習賦予 AI 代理人理解和執(zhí)行創(chuàng)作拼貼藝術品的微妙步驟的能力。
研究人員的方法是通過訓練 RL 模型與畫布進行交互,在拼貼藝術品創(chuàng)作過程的每個步驟上做出決策。在訓練過程中,AI 代理人被隨機分配的圖像所喂養(yǎng),從而學會適應后續(xù)的任何目標或材料。通過多種剪切和粘貼選項,RL 代理人嘗試使用不同的材料,以確定哪些材料能夠產(chǎn)生與目標圖像相似的拼貼藝術品。獎勵系統(tǒng)隨著時間的推移而發(fā)展,主要是增強代理人制作的拼貼藝術品與目標圖像之間的相似性。
一個關鍵的方面是開發(fā)可微分的拼貼環(huán)境,以便應用基于模型的 RL。這個環(huán)境可以讓代理人輕松跟蹤拼貼藝術品創(chuàng)作過程的動態(tài)。該團隊的模型在各種圖像和場景中具有很好的泛化能力。該架構的突出特點在于其自主性,它不需要拼貼樣本或演示數(shù)據(jù),強調(diào)了 RL 提供的強大無數(shù)據(jù)學習領域的潛力。
評估包括用戶研究和基于 CLIP 的評估。結果表明,與其他基于像素的生成模型相比,該方法的性能更優(yōu)。該方法的應用標志著 AI 生成的拼貼藝術品在模仿人類藝術創(chuàng)作深度方面邁出了重要的一步。
首爾國立大學的研究團隊成功地利用強化學習訓練了能夠真正創(chuàng)作拼貼藝術品的 AI 代理人。他們的創(chuàng)新模型超越了現(xiàn)有的基于像素的方法,展示了強化學習在使代理人能夠自主學習和執(zhí)行創(chuàng)作真正拼貼藝術品的復雜步驟方面的潛力。通過用戶研究和客觀評估的驗證,這一突破為 AI 在藝術創(chuàng)作中開辟了新的道路,為機器在視覺藝術領域有意義地貢獻創(chuàng)造了前景。
論文網(wǎng)址:https://arxiv.org/abs/2311.02202
(舉報)