中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

    <td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>
    <rp id="h1kkc"></rp>
    首頁(yè) > 業(yè)界 > 關(guān)鍵詞  > ImagenHub最新資訊  > 正文

    ImagenHub官網(wǎng)體驗(yàn)入口 AI圖像生成模型評(píng)估平臺(tái)使用指南方法教程

    2024-04-08 16:13 · 稿源:站長(zhǎng)之家用戶

    ImagenHub是一個(gè)一站式庫(kù),用于標(biāo)準(zhǔn)化所有條件圖像生成模型的推理和評(píng)估。該項(xiàng)目首先定義了七個(gè)突出的任務(wù)并創(chuàng)建了高質(zhì)量的評(píng)估數(shù)據(jù)集。其次,我們構(gòu)建了一個(gè)統(tǒng)一的推理管道來(lái)確保公平比較。第三,我們?cè)O(shè)計(jì)了兩個(gè)人工評(píng)估指標(biāo),即語(yǔ)義一致性和感知質(zhì)量,并制定了全面的指南來(lái)評(píng)估生成的圖像。我們訓(xùn)練專家評(píng)審員根據(jù)提出的指標(biāo)來(lái)評(píng)估模型輸出。該人工評(píng)估在76%的模型上實(shí)現(xiàn)了高的評(píng)估者間一致性。我們?nèi)娴卦u(píng)估了約 30 個(gè)模型,并觀察到三個(gè)關(guān)鍵發(fā)現(xiàn):

    ImagenHub

    點(diǎn)擊前往ImagenHub官網(wǎng)體驗(yàn)入口

    (1)現(xiàn)有模型的性能普遍不令人滿意,除了文本引導(dǎo)的圖像生成和主題驅(qū)動(dòng)的圖像生成外,74%的模型整體得分低于0.5。 (2)我們檢查了已發(fā)表論文中的聲明,發(fā)現(xiàn)83%的聲明是正確的。 (3)除了主題驅(qū)動(dòng)的圖像生成外,現(xiàn)有的自動(dòng)評(píng)估指標(biāo)都沒(méi)有高于0. 2 的斯皮爾曼相關(guān)系數(shù)。未來(lái),我們將繼續(xù)努力評(píng)估新發(fā)布的模型,并更新排行榜以跟蹤條件圖像生成領(lǐng)域的進(jìn)展。

    ImagenHub的應(yīng)用場(chǎng)景示例

    ImagenHub收集了七個(gè)主要的條件圖像生成任務(wù),包括文本引導(dǎo)的圖像生成、掩碼引導(dǎo)的圖像編輯、主題驅(qū)動(dòng)的圖像生成等,為研究人員提供了全面的評(píng)估數(shù)據(jù)集。

    ImagenHub建立了統(tǒng)一的推理管道,確保不同模型在相同的評(píng)估流程下進(jìn)行公平比較。

    ImagenHub設(shè)計(jì)了兩個(gè)人工評(píng)估指標(biāo),語(yǔ)義一致性和感知質(zhì)量,并訓(xùn)練專家評(píng)審員根據(jù)這些指標(biāo)對(duì)模型輸出進(jìn)行評(píng)估,獲得了高的評(píng)估者間一致性。

    產(chǎn)品特色:

    • 定義七個(gè)主要的條件圖像生成任務(wù)
    • 構(gòu)建高質(zhì)量的評(píng)估數(shù)據(jù)集
    • 建立統(tǒng)一的推理管道
    • 設(shè)計(jì)語(yǔ)義一致性和感知質(zhì)量?jī)蓚€(gè)人工評(píng)估指標(biāo)
    • 訓(xùn)練專家評(píng)審員進(jìn)行評(píng)估
    • 全面評(píng)估約 30 個(gè)條件圖像生成模型
    • 更新排行榜跟蹤領(lǐng)域進(jìn)展

    舉報(bào)

    • 相關(guān)推薦
    • AI日?qǐng)?bào):阿里騰訊全面支持MCP協(xié)議;階躍星辰多模態(tài)推理模型Step-R1-V-Mini;美WHEE圖像生成模型Miracle F1

      歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開(kāi)發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、阿里巴巴已宣布全面支持MCP協(xié)議騰訊緊隨其后近日,中國(guó)人工智能領(lǐng)域迎來(lái)技術(shù)標(biāo)準(zhǔn)的變革,ModelContextProtocol成為國(guó)內(nèi)AI生態(tài)的事實(shí)標(biāo)準(zhǔn)。12.英偉達(dá)發(fā)布Llama3.1NemotronUltra253B,性能?

    • 字節(jié)發(fā)布豆包1.5深度思考模型:“實(shí)拍級(jí)”圖像生成

      快科技4月17日消息,據(jù)報(bào)道,今日,在火山引擎AI創(chuàng)新巡展杭州站的現(xiàn)場(chǎng),字節(jié)跳動(dòng)旗下火山引擎總裁譚待正式發(fā)布了備受矚目的豆包1.5深度思考模型。譚待指出,豆包1.5深度思考模型在多個(gè)關(guān)鍵領(lǐng)域展現(xiàn)出卓越性能。在數(shù)學(xué)、編程、科學(xué)推理這類專業(yè)領(lǐng)域中,它能夠精準(zhǔn)高效地處理復(fù)雜問(wèn)題;在創(chuàng)意寫作等通用任務(wù)方面,同樣表現(xiàn)出色。該模型采用MoE架構(gòu),總參數(shù)為200B,激?

    • AI日?qǐng)?bào): OpenAI推出gpt-image-1圖像生成API;納米AI發(fā)布MCP萬(wàn)能工具箱;中國(guó)占全球AI專利60%

      【AI日?qǐng)?bào)】欄目聚焦人工智能領(lǐng)域最新動(dòng)態(tài):1) OpenAI推出ChatGPT圖像生成API,開(kāi)發(fā)者可輕松集成AI繪圖功能,已生成超7億張圖片;2) 谷歌Gemini月活用戶突破3.5億,但仍落后于ChatGPT的6億用戶;3) OpenAI預(yù)測(cè)2029年收入將達(dá)1250億美元,AI代理業(yè)務(wù)成主要增長(zhǎng)點(diǎn);4) Ostris發(fā)布8B參數(shù)擴(kuò)散模型Flex.2-preview,優(yōu)化ComfyUI工作流;5) 英偉達(dá)推出多模態(tài)LLM模型Describe Anything,支持指定區(qū)域生成詳細(xì)描?

    • UniToken:多模態(tài)AI的“全能選手”,一次編碼搞定文理解與圖像生成

      復(fù)旦大學(xué)與美團(tuán)研究者提出UniToken框架,首次在統(tǒng)一模型中實(shí)現(xiàn)圖文理解與生成任務(wù)的"雙優(yōu)表現(xiàn)"。該方案融合連續(xù)和離散視覺(jué)編碼,有效解決了傳統(tǒng)多模態(tài)建模中的"任務(wù)干擾"和"表示割裂"問(wèn)題。通過(guò)三階段訓(xùn)練策略(視覺(jué)語(yǔ)義對(duì)齊、多任務(wù)聯(lián)合訓(xùn)練、指令強(qiáng)化微調(diào)),UniToken在多個(gè)基準(zhǔn)測(cè)試中性能超越專用模型。其創(chuàng)新性體現(xiàn)在:1)統(tǒng)一的雙邊視覺(jué)編碼

    • 視頻生成模型Vidu Q1怎么用?Vidu Q1官網(wǎng)是什么?

      國(guó)產(chǎn)視頻生成大模型Vidu Q1在性能、價(jià)格和功能上實(shí)現(xiàn)重大突破。該模型由生數(shù)科技推出,在VBench評(píng)測(cè)中超越Sora等國(guó)內(nèi)外頂尖模型,支持1080p高清視頻生成,每秒價(jià)格低至3毛錢。其首尾幀功能僅需兩張圖即可實(shí)現(xiàn)電影級(jí)運(yùn)鏡效果,支持多元風(fēng)格生成和48kHz高采樣率混音功能。Vidu Q1已深度賦能影視、廣告、動(dòng)漫等行業(yè),大幅降低創(chuàng)作門檻。

    • ChatGPT圖像生成爆火!OpenAI CEO在線求助:急需10萬(wàn)塊GPU

      OpenAI近期推出的全新圖像生成工具引發(fā)了熱潮,用戶使用ChatGPT即可創(chuàng)作出吉卜力等風(fēng)格的AI藝術(shù)作品。這一功能不僅推動(dòng)了ChatGPT用戶數(shù)的創(chuàng)新高導(dǎo)致服務(wù)器負(fù)擔(dān)過(guò)重,甚至一度限制了該功能的使用。SensorTower的數(shù)據(jù)顯示,ChatGPT應(yīng)用的全球下載量和每周活躍用戶數(shù)分別較上周增長(zhǎng)了11%和5%應(yīng)用內(nèi)購(gòu)買收入則增加了6%。

    • AI日?qǐng)?bào):騰訊混元3D生成模型2.5版本發(fā)布;海螺推出圖像人物參考功能;百度上線移動(dòng)端超級(jí)智能體心響App

      本文介紹了多款A(yù)I領(lǐng)域的新產(chǎn)品和技術(shù)進(jìn)展:1)Kortix-AI推出開(kāi)源通用AI智能體平臺(tái)Suna;2)騰訊混元3D生成模型升級(jí)至2.5版本;3)海螺AI推出基于單張圖像生成多角度角色圖像功能;4)百度發(fā)布"心響"App整合多智能體協(xié)作;5)Nari Labs開(kāi)源媲美真人的對(duì)話語(yǔ)音模型Dia;6)Grok新增視覺(jué)處理和多語(yǔ)言支持;7)Genspark推出AI幻燈片工具;8)Character.AI發(fā)布讓靜態(tài)圖片"說(shuō)話"的AvatarFX模型;9)pad.ws結(jié)合白板和代碼編輯器;10)OpenBMB開(kāi)源社區(qū)推出長(zhǎng)文本生成模型"卷姬";11)騰訊推出AI閱讀助手"企鵝讀伴";12)OpenAI有意收購(gòu)Chrome瀏覽器;13)字節(jié)跳動(dòng)調(diào)整AI產(chǎn)品線布局。這些創(chuàng)新展現(xiàn)了AI技術(shù)在自動(dòng)化、3D生成、語(yǔ)音交互、內(nèi)容創(chuàng)作等領(lǐng)域的快速發(fā)展。

    • 微軟上線GPT-image-1模型 通過(guò)API向開(kāi)發(fā)者開(kāi)放使用

      OpenAI于4月24日發(fā)布全新圖像生成模型GPT-image-1,通過(guò)API向全球開(kāi)發(fā)者開(kāi)放。該模型支持生成高質(zhì)量圖像,具備多級(jí)定制功能,包括控制敏感度、生成效率、背景、輸出格式等參數(shù),并推出"吉卜力模式"生成獨(dú)特風(fēng)格圖像。Adobe、Figma等多家企業(yè)已將其集成到產(chǎn)品中。API定價(jià)按token計(jì)算,低質(zhì)量圖像生成成本約0.02美元/張。OpenAI CEO Sam Altman高度評(píng)價(jià)該模型,認(rèn)為其為開(kāi)發(fā)者帶來(lái)更大創(chuàng)意空間。

    • 剛剛,OpenAI發(fā)布GPT-image-1模型,更強(qiáng)吉卜力版本來(lái)啦

      OpenAI發(fā)布全新圖像生成模型GPT-image-1,通過(guò)API向全球開(kāi)發(fā)者開(kāi)放。該模型支持精細(xì)控制圖像敏感度、生成效率、背景、輸出格式等參數(shù),并集成吉卜力模式。Adobe、Figma等企業(yè)已將其應(yīng)用于產(chǎn)品中。API支持批量生成、蒙版編輯、透明度調(diào)整等高級(jí)功能,圖像生成成本從0.02-0.19美元/張不等。CEO Sam Altman表示該模型與ChatGPT版本差異顯著,開(kāi)發(fā)者可通過(guò)API實(shí)現(xiàn)更多創(chuàng)意場(chǎng)景。新模型在?

    • 谷歌Gemini整合Veo 2視頻生成模型,8秒720P視頻輕松搞定

      谷歌宣布又有一款 AI 模型將加入 Gemini,但這次它不僅僅是一個(gè)聊天機(jī)器人。