中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

<td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>

<rp id="h1kkc"></rp>

<td id="cqaw2"></td>

<cite id="cqaw2"></cite>

<input id="cqaw2"><tbody id="cqaw2"></tbody></input>

<samp id="cqaw2"></samp>

ImagenHub官網(wǎng)體驗(yàn)入口 AI圖像生成模型評(píng)估平臺(tái)使用指南方法教程

2024-04-08 16:13 · 稿源：站長(zhǎng)之家用戶

ImagenHub是一個(gè)一站式庫(kù)，用于標(biāo)準(zhǔn)化所有條件圖像生成模型的推理和評(píng)估。該項(xiàng)目首先定義了七個(gè)突出的任務(wù)并創(chuàng)建了高質(zhì)量的評(píng)估數(shù)據(jù)集。其次，我們構(gòu)建了一個(gè)統(tǒng)一的推理管道來(lái)確保公平比較。第三，我們?cè)O(shè)計(jì)了兩個(gè)人工評(píng)估指標(biāo)，即語(yǔ)義一致性和感知質(zhì)量，并制定了全面的指南來(lái)評(píng)估生成的圖像。我們訓(xùn)練專家評(píng)審員根據(jù)提出的指標(biāo)來(lái)評(píng)估模型輸出。該人工評(píng)估在76%的模型上實(shí)現(xiàn)了高的評(píng)估者間一致性。我們?nèi)娴卦u(píng)估了約 30 個(gè)模型，并觀察到三個(gè)關(guān)鍵發(fā)現(xiàn)：

ImagenHub

點(diǎn)擊前往ImagenHub官網(wǎng)體驗(yàn)入口

(1)現(xiàn)有模型的性能普遍不令人滿意，除了文本引導(dǎo)的圖像生成和主題驅(qū)動(dòng)的圖像生成外，74%的模型整體得分低于0.5。 (2)我們檢查了已發(fā)表論文中的聲明，發(fā)現(xiàn)83%的聲明是正確的。 (3)除了主題驅(qū)動(dòng)的圖像生成外，現(xiàn)有的自動(dòng)評(píng)估指標(biāo)都沒(méi)有高于0. 2 的斯皮爾曼相關(guān)系數(shù)。未來(lái)，我們將繼續(xù)努力評(píng)估新發(fā)布的模型，并更新排行榜以跟蹤條件圖像生成領(lǐng)域的進(jìn)展。

ImagenHub的應(yīng)用場(chǎng)景示例

ImagenHub收集了七個(gè)主要的條件圖像生成任務(wù)，包括文本引導(dǎo)的圖像生成、掩碼引導(dǎo)的圖像編輯、主題驅(qū)動(dòng)的圖像生成等，為研究人員提供了全面的評(píng)估數(shù)據(jù)集。

ImagenHub建立了統(tǒng)一的推理管道，確保不同模型在相同的評(píng)估流程下進(jìn)行公平比較。

ImagenHub設(shè)計(jì)了兩個(gè)人工評(píng)估指標(biāo)，語(yǔ)義一致性和感知質(zhì)量，并訓(xùn)練專家評(píng)審員根據(jù)這些指標(biāo)對(duì)模型輸出進(jìn)行評(píng)估，獲得了高的評(píng)估者間一致性。

產(chǎn)品特色：

定義七個(gè)主要的條件圖像生成任務(wù)
構(gòu)建高質(zhì)量的評(píng)估數(shù)據(jù)集
建立統(tǒng)一的推理管道
設(shè)計(jì)語(yǔ)義一致性和感知質(zhì)量?jī)蓚€(gè)人工評(píng)估指標(biāo)
訓(xùn)練專家評(píng)審員進(jìn)行評(píng)估
全面評(píng)估約 30 個(gè)條件圖像生成模型
更新排行榜跟蹤領(lǐng)域進(jìn)展

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

ImagenHub

AI日?qǐng)?bào)：阿里騰訊全面支持MCP協(xié)議；階躍星辰多模態(tài)推理模型Step-R1-V-Mini；美圖WHEE圖像生成模型Miracle F1

歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開(kāi)發(fā)者，助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、阿里巴巴已宣布全面支持MCP協(xié)議騰訊緊隨其后近日，中國(guó)人工智能領(lǐng)域迎來(lái)技術(shù)標(biāo)準(zhǔn)的變革，ModelContextProtocol成為國(guó)內(nèi)AI生態(tài)的事實(shí)標(biāo)準(zhǔn)。12.英偉達(dá)發(fā)布Llama3.1NemotronUltra253B，性能?

?人工智能 ?MCP協(xié)議 ?阿里巴巴
字節(jié)發(fā)布豆包1.5深度思考模型：“實(shí)拍級(jí)”圖像生成

快科技4月17日消息，據(jù)報(bào)道，今日，在火山引擎AI創(chuàng)新巡展杭州站的現(xiàn)場(chǎng)，字節(jié)跳動(dòng)旗下火山引擎總裁譚待正式發(fā)布了備受矚目的豆包1.5深度思考模型。譚待指出，豆包1.5深度思考模型在多個(gè)關(guān)鍵領(lǐng)域展現(xiàn)出卓越性能。在數(shù)學(xué)、編程、科學(xué)推理這類專業(yè)領(lǐng)域中，它能夠精準(zhǔn)高效地處理復(fù)雜問(wèn)題；在創(chuàng)意寫作等通用任務(wù)方面，同樣表現(xiàn)出色。該模型采用MoE架構(gòu)，總參數(shù)為200B，激?

?豆包1.5深度思考模型 ?火山引擎AI創(chuàng)新 ?字節(jié)跳動(dòng)技術(shù)發(fā)布
AI日?qǐng)?bào)： OpenAI推出gpt-image-1圖像生成API;納米AI發(fā)布MCP萬(wàn)能工具箱;中國(guó)占全球AI專利60%

【AI日?qǐng)?bào)】欄目聚焦人工智能領(lǐng)域最新動(dòng)態(tài)：1) OpenAI推出ChatGPT圖像生成API，開(kāi)發(fā)者可輕松集成AI繪圖功能，已生成超7億張圖片；2) 谷歌Gemini月活用戶突破3.5億，但仍落后于ChatGPT的6億用戶；3) OpenAI預(yù)測(cè)2029年收入將達(dá)1250億美元，AI代理業(yè)務(wù)成主要增長(zhǎng)點(diǎn)；4) Ostris發(fā)布8B參數(shù)擴(kuò)散模型Flex.2-preview，優(yōu)化ComfyUI工作流；5) 英偉達(dá)推出多模態(tài)LLM模型Describe Anything，支持指定區(qū)域生成詳細(xì)描?

?OpenAI ?ChatGPT ?圖像生成
薦UniToken：多模態(tài)AI的“全能選手”，一次編碼搞定圖文理解與圖像生成

復(fù)旦大學(xué)與美團(tuán)研究者提出UniToken框架，首次在統(tǒng)一模型中實(shí)現(xiàn)圖文理解與生成任務(wù)的"雙優(yōu)表現(xiàn)"。該方案融合連續(xù)和離散視覺(jué)編碼，有效解決了傳統(tǒng)多模態(tài)建模中的"任務(wù)干擾"和"表示割裂"問(wèn)題。通過(guò)三階段訓(xùn)練策略（視覺(jué)語(yǔ)義對(duì)齊、多任務(wù)聯(lián)合訓(xùn)練、指令強(qiáng)化微調(diào)），UniToken在多個(gè)基準(zhǔn)測(cè)試中性能超越專用模型。其創(chuàng)新性體現(xiàn)在：1）統(tǒng)一的雙邊視覺(jué)編碼

?UniToken ?多模態(tài)建模 ?視覺(jué)編碼
視頻生成模型Vidu Q1怎么用？Vidu Q1官網(wǎng)是什么？

國(guó)產(chǎn)視頻生成大模型Vidu Q1在性能、價(jià)格和功能上實(shí)現(xiàn)重大突破。該模型由生數(shù)科技推出，在VBench評(píng)測(cè)中超越Sora等國(guó)內(nèi)外頂尖模型，支持1080p高清視頻生成，每秒價(jià)格低至3毛錢。其首尾幀功能僅需兩張圖即可實(shí)現(xiàn)電影級(jí)運(yùn)鏡效果，支持多元風(fēng)格生成和48kHz高采樣率混音功能。Vidu Q1已深度賦能影視、廣告、動(dòng)漫等行業(yè)，大幅降低創(chuàng)作門檻。

?國(guó)產(chǎn)視頻生成 ?Vidu ?Q1
ChatGPT圖像生成爆火！OpenAI CEO在線求助：急需10萬(wàn)塊GPU

OpenAI近期推出的全新圖像生成工具引發(fā)了熱潮，用戶使用ChatGPT即可創(chuàng)作出吉卜力等風(fēng)格的AI藝術(shù)作品。這一功能不僅推動(dòng)了ChatGPT用戶數(shù)的創(chuàng)新高導(dǎo)致服務(wù)器負(fù)擔(dān)過(guò)重，甚至一度限制了該功能的使用。SensorTower的數(shù)據(jù)顯示，ChatGPT應(yīng)用的全球下載量和每周活躍用戶數(shù)分別較上周增長(zhǎng)了11%和5%應(yīng)用內(nèi)購(gòu)買收入則增加了6%。

?OpenAI ?ChatGPT ?圖像生成
薦AI日?qǐng)?bào)：騰訊混元3D生成模型2.5版本發(fā)布；海螺推出圖像人物參考功能；百度上線移動(dòng)端超級(jí)智能體心響App

本文介紹了多款A(yù)I領(lǐng)域的新產(chǎn)品和技術(shù)進(jìn)展：1)Kortix-AI推出開(kāi)源通用AI智能體平臺(tái)Suna；2)騰訊混元3D生成模型升級(jí)至2.5版本；3)海螺AI推出基于單張圖像生成多角度角色圖像功能；4)百度發(fā)布"心響"App整合多智能體協(xié)作；5)Nari Labs開(kāi)源媲美真人的對(duì)話語(yǔ)音模型Dia；6)Grok新增視覺(jué)處理和多語(yǔ)言支持；7)Genspark推出AI幻燈片工具；8)Character.AI發(fā)布讓靜態(tài)圖片"說(shuō)話"的AvatarFX模型；9)pad.ws結(jié)合白板和代碼編輯器；10)OpenBMB開(kāi)源社區(qū)推出長(zhǎng)文本生成模型"卷姬"；11)騰訊推出AI閱讀助手"企鵝讀伴"；12)OpenAI有意收購(gòu)Chrome瀏覽器；13)字節(jié)跳動(dòng)調(diào)整AI產(chǎn)品線布局。這些創(chuàng)新展現(xiàn)了AI技術(shù)在自動(dòng)化、3D生成、語(yǔ)音交互、內(nèi)容創(chuàng)作等領(lǐng)域的快速發(fā)展。

?人工智能 ?AI產(chǎn)品 ?開(kāi)源平臺(tái)
微軟上線GPT-image-1模型通過(guò)API向開(kāi)發(fā)者開(kāi)放使用

OpenAI于4月24日發(fā)布全新圖像生成模型GPT-image-1，通過(guò)API向全球開(kāi)發(fā)者開(kāi)放。該模型支持生成高質(zhì)量圖像，具備多級(jí)定制功能，包括控制敏感度、生成效率、背景、輸出格式等參數(shù)，并推出"吉卜力模式"生成獨(dú)特風(fēng)格圖像。Adobe、Figma等多家企業(yè)已將其集成到產(chǎn)品中。API定價(jià)按token計(jì)算，低質(zhì)量圖像生成成本約0.02美元/張。OpenAI CEO Sam Altman高度評(píng)價(jià)該模型，認(rèn)為其為開(kāi)發(fā)者帶來(lái)更大創(chuàng)意空間。

?OpenAI ?圖像生成 ?GPT-image-1
薦剛剛，OpenAI發(fā)布GPT-image-1模型，更強(qiáng)吉卜力版本來(lái)啦

OpenAI發(fā)布全新圖像生成模型GPT-image-1，通過(guò)API向全球開(kāi)發(fā)者開(kāi)放。該模型支持精細(xì)控制圖像敏感度、生成效率、背景、輸出格式等參數(shù)，并集成吉卜力模式。Adobe、Figma等企業(yè)已將其應(yīng)用于產(chǎn)品中。API支持批量生成、蒙版編輯、透明度調(diào)整等高級(jí)功能，圖像生成成本從0.02-0.19美元/張不等。CEO Sam Altman表示該模型與ChatGPT版本差異顯著，開(kāi)發(fā)者可通過(guò)API實(shí)現(xiàn)更多創(chuàng)意場(chǎng)景。新模型在?

?OpenAI ?GPT-image-1 ?圖像生成
谷歌Gemini整合Veo 2視頻生成模型，8秒720P視頻輕松搞定

谷歌宣布又有一款 AI 模型將加入 Gemini，但這次它不僅僅是一個(gè)聊天機(jī)器人。

?谷歌 ?谷歌gemini ?veo2

熱文

3 天
7天

站長(zhǎng)商機(jī)

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM

<bdo id="qmomc"></bdo>

<bdo id="qmomc"></bdo>

<center id="qmomc"><optgroup id="qmomc"></optgroup></center>

<bdo id="qmomc"><strong id="qmomc"></strong></bdo>

<dfn id="qmomc"><delect id="qmomc"></delect></dfn>