11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個(gè)月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享??靵?lái)騰訊云選購(gòu)吧!
GPT-4o,被擊敗了?最近大伙都被GPT-4o生成的各種“整活”圖像刷屏了吧,各種動(dòng)漫油畫(huà)風(fēng)格改圖、經(jīng)典影視復(fù)現(xiàn)、漫畫(huà)設(shè)計(jì)改圖……新的玩法每天都在涌現(xiàn),大有“AI一日,人間一年”之勢(shì)。甚至OpenAICEOSamAltman都累了:“收手吧,我們需要休息!”但就在GPT-4o火遍全球之際,一個(gè)來(lái)自初創(chuàng)團(tuán)隊(duì)的新模型ReveImage,卻憑借其在特定圖像生成領(lǐng)域的出色表現(xiàn),悄然贏得了用戶和專業(yè)榜單的
今天凌晨2點(diǎn),OpenAI進(jìn)行了技術(shù)直播,對(duì)GPT-4o和Sora進(jìn)行了重大更新,提供了全新文生圖模型。除了文生圖之外,該模型還支持自定義操作、連續(xù)發(fā)問(wèn)、風(fēng)格轉(zhuǎn)換、圖像PPT等超實(shí)用功能,例如,更改圖片的寬高比、圖像物體中的角度,用十六進(jìn)制代碼指定精確顏色等。面向企業(yè)版、教育版和API即將到來(lái)。
歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開(kāi)發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、智譜發(fā)布首個(gè)能生成漢字的開(kāi)源文生圖模型CogView42025年3月4日,北京智譜華章科技有限公司推出了CogView4,這是首個(gè)支持生成漢字的開(kāi)源文生圖模型,具備強(qiáng)大的雙語(yǔ)輸入和圖像生成能力。他強(qiáng)調(diào)了完善人工智能終端標(biāo)準(zhǔn)體系的重要性,呼吁制定以用戶體驗(yàn)為導(dǎo)向的智能化分級(jí)標(biāo)準(zhǔn),并強(qiáng)化國(guó)際國(guó)內(nèi)標(biāo)準(zhǔn)的有效銜接。
歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開(kāi)發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、震撼登場(chǎng)!英偉達(dá)開(kāi)源圖像生成模型Sana,1秒生圖、支持中英文和emoji英偉達(dá)近日開(kāi)源了圖像生成模型Sana,憑借僅0.6億個(gè)參數(shù)和高達(dá)4096×4096分辨率的生成能力,極大降低了使用門(mén)檻
著名大模型開(kāi)源平臺(tái)StabilityAI,開(kāi)源了超強(qiáng)文生圖模型——StableDiffusion3.5。StableDiffusion3.5一共有Large、LargeTurbo和Medium三個(gè)版本,可根據(jù)不同的商業(yè)環(huán)境提供高度定制功能,同時(shí)對(duì)這些模型進(jìn)行了大幅度優(yōu)化可在消費(fèi)級(jí)GPU就能輕松推理運(yùn)行。StableDiffusion3.5在可定制性、高效的性能以及多樣化的輸出方面表現(xiàn)出色,使其成為市場(chǎng)上最可定制和最易訪問(wèn)的文生圖像模型之一,同時(shí)在提
打造更強(qiáng)大文生圖模型新思路有——面對(duì)Flux、stablediffusion、Omost等爆火模型,有人開(kāi)始主打“集各家所長(zhǎng)”。清北、牛津、普林斯頓等機(jī)構(gòu)的研究者提出了?個(gè)全新文生圖框架IterComp。更多細(xì)節(jié)歡迎查閱原論文。
比美國(guó)SB-1047更瘋狂的法案來(lái)了——AB-3211。AB-3211是美國(guó)加州在今年2月16日制定的一項(xiàng)專門(mén)針對(duì)文生圖模型的法案,經(jīng)過(guò)6次修訂最近以62:0投票在州參議院通過(guò)。但對(duì)于那些沒(méi)有資金、資源的開(kāi)源開(kāi)發(fā)者來(lái)說(shuō),已經(jīng)無(wú)法像以前一樣把項(xiàng)目直接扔在Github上就行了,需要一直改到符合技術(shù)標(biāo)準(zhǔn)為止,不然就無(wú)法分享你的項(xiàng)目。
【新智元導(dǎo)讀】近日,來(lái)自加州大學(xué)爾灣分校等機(jī)構(gòu)的研究人員,利用延遲掩蔽、MoE、分層擴(kuò)展等策略,將擴(kuò)散模型的訓(xùn)練成本降到了1890美元。訓(xùn)練一個(gè)擴(kuò)散模型要多少錢?之前最便宜的方法用了28400美元像StableDiffusion這樣的模型還要再貴一個(gè)數(shù)量級(jí)。由上表結(jié)果可知發(fā)現(xiàn),在所有三個(gè)性能指標(biāo)上,分層縮放方法都優(yōu)于基線的恒定寬度方法,這表明分層縮放方法更適合DiT的掩蔽?
昨天Midjourney剛進(jìn)行大更新,今天文生圖片開(kāi)源領(lǐng)域就殺出了一匹大黑馬—FLUX.1。根據(jù)其測(cè)試數(shù)據(jù)顯示,性能大幅度超過(guò)了DALL·E-3、MidjourneyV6閉源模型,開(kāi)源SD3系列的Ultra、Medium、Turbo和SDXL被全線秒殺。FLUX.1生成的圖片質(zhì)量、細(xì)節(jié)和光影效果還行吧,期待一下他的文生視頻模型。
PixArt-sigma由華為諾亞方舟實(shí)驗(yàn)室聯(lián)合多個(gè)研究機(jī)構(gòu)共同開(kāi)發(fā)的項(xiàng)目,是一個(gè)強(qiáng)大的文本到圖像生成模型,通過(guò)彌散Transformer進(jìn)行弱到強(qiáng)訓(xùn)練,旨在實(shí)現(xiàn)4K分辨率的圖像生成。PixArt-sigma采用了彌散Transformer進(jìn)行弱到強(qiáng)訓(xùn)練,從能夠更好地生成高質(zhì)量的4K分辨率圖像。在應(yīng)用方面,PixArt-Σ是一款強(qiáng)大的文本到圖像生成工具,具有廣泛的應(yīng)用場(chǎng)景,可以滿足藝術(shù)、設(shè)計(jì)、游戲開(kāi)發(fā)、營(yíng)銷