Imagen2 是Google DeepMind開發(fā)的最先進(jìn)的文本到圖像擴散技術(shù)產(chǎn)品,可生成高品質(zhì)、逼真的圖像,與用戶的文字提示緊密對齊。這款技術(shù)利用其訓(xùn)練數(shù)據(jù)的自然分布生成更逼真的圖像,而不是采用預(yù)設(shè)的風(fēng)格。開發(fā)者和Cloud客戶可以通過Google Cloud Vertex AI上的Imagen API體驗Imagen2 的強大功能。Google藝術(shù)與文化團隊也在他們的「文化圖標(biāo)」實驗中部署了Imagen2 技術(shù),讓用戶借助Google AI探索、學(xué)習(xí)和測試他們的文化知識。
Imagen2 的改進(jìn)之處包括:
- 改進(jìn)的圖像-字幕理解:Imagen2 通過在訓(xùn)練數(shù)據(jù)集的圖像和字幕中添加更多描述來創(chuàng)建更高質(zhì)量、更準(zhǔn)確的圖像,以更好地匹配用戶的提示。這些增強的圖像-字幕配對幫助Imagen2 更好地理解圖像和文字之間的關(guān)系,提升了對語境和細(xì)微差別的理解。
- 更逼真的圖像生成:Imagen2 的數(shù)據(jù)集和模型進(jìn)步在許多文本到圖像工具常掙扎的領(lǐng)域取得了改進(jìn),包括逼真地渲染手和人臉,以及保持圖像免受干擾的視覺偽影。
- 流暢的風(fēng)格條件:Imagen2 的基于擴散的技術(shù)提供了高度的靈活性,使得控制和調(diào)整圖像風(fēng)格變得更容易。通過結(jié)合引用風(fēng)格圖像和文本提示,可以使Imagen2 生成遵循同樣風(fēng)格的新圖像。
- 先進(jìn)的內(nèi)畫和外畫技術(shù):Imagen2 還啟用了像‘內(nèi)畫’和‘外畫’這樣的圖像編輯功能。通過提供參考圖像和圖像蒙版,用戶可以直接在原始圖像中生成新內(nèi)容,或?qū)⒃紙D像擴展到其邊界之外。
Imagen2 在設(shè)計和開發(fā)階段就設(shè)立了強有力的防護(hù)措施,以幫助減輕其文本到圖像生成技術(shù)可能帶來的風(fēng)險和挑戰(zhàn)。Imagen2 集成了先進(jìn)工具包SynthID,用于水印和識別AI生成的內(nèi)容,允許列入白名單的Google Cloud客戶直接在圖像的像素中添加不可感知的數(shù)字水印,而不影響圖像質(zhì)量。在向用戶發(fā)布功能之前,我們會進(jìn)行嚴(yán)格的安全測試,以盡量減少傷害風(fēng)險。
以上就是「Imagen 2」的全部介紹了,感興趣的小伙伴可以點擊上方鏈接前往體驗!
(舉報)