11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個(gè)月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享。快來(lái)騰訊云選購(gòu)吧!
蘋果開源了一種新的技術(shù),名為多模態(tài)大語(yǔ)言模型引導(dǎo)的編輯,這項(xiàng)技術(shù)能夠幫助用戶通過(guò)自然語(yǔ)言指令來(lái)修改圖片,使得編輯圖片更加簡(jiǎn)單和自然。MGIE采用多模態(tài)大型語(yǔ)言模型進(jìn)行圖像編輯指令的生成,通過(guò)端到端訓(xùn)練,模型不僅捕捉視覺(jué)想象力執(zhí)行圖像處理操作。在實(shí)現(xiàn)更加直觀和自由的圖像編輯過(guò)程中,這一方法有望為未來(lái)的計(jì)算機(jī)視覺(jué)和圖像處理研究提供新的思路。