11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享??靵眚v訊云選購吧!
復(fù)旦大學(xué)與美團(tuán)研究者提出UniToken框架,首次在統(tǒng)一模型中實現(xiàn)圖文理解與生成任務(wù)的"雙優(yōu)表現(xiàn)"。該方案融合連續(xù)和離散視覺編碼,有效解決了傳統(tǒng)多模態(tài)建模中的"任務(wù)干擾"和"表示割裂"問題。通過三階段訓(xùn)練策略(視覺語義對齊、多任務(wù)聯(lián)合訓(xùn)練、指令強(qiáng)化微調(diào)),UniToken在多個基準(zhǔn)測試中性能超越專用模型。其創(chuàng)新性體現(xiàn)在:1)統(tǒng)一的雙邊視覺編碼
【AI日報】欄目聚焦人工智能領(lǐng)域最新動態(tài):1) OpenAI推出ChatGPT圖像生成API,開發(fā)者可輕松集成AI繪圖功能,已生成超7億張圖片;2) 谷歌Gemini月活用戶突破3.5億,但仍落后于ChatGPT的6億用戶;3) OpenAI預(yù)測2029年收入將達(dá)1250億美元,AI代理業(yè)務(wù)成主要增長點(diǎn);4) Ostris發(fā)布8B參數(shù)擴(kuò)散模型Flex.2-preview,優(yōu)化ComfyUI工作流;5) 英偉達(dá)推出多模態(tài)LLM模型Describe Anything,支持指定區(qū)域生成詳細(xì)描?
快科技4月17日消息,據(jù)報道,今日,在火山引擎AI創(chuàng)新巡展杭州站的現(xiàn)場,字節(jié)跳動旗下火山引擎總裁譚待正式發(fā)布了備受矚目的豆包1.5深度思考模型。譚待指出,豆包1.5深度思考模型在多個關(guān)鍵領(lǐng)域展現(xiàn)出卓越性能。在數(shù)學(xué)、編程、科學(xué)推理這類專業(yè)領(lǐng)域中,它能夠精準(zhǔn)高效地處理復(fù)雜問題;在創(chuàng)意寫作等通用任務(wù)方面,同樣表現(xiàn)出色。該模型采用MoE架構(gòu),總參數(shù)為200B,激?
歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、阿里巴巴已宣布全面支持MCP協(xié)議騰訊緊隨其后近日,中國人工智能領(lǐng)域迎來技術(shù)標(biāo)準(zhǔn)的變革,ModelContextProtocol成為國內(nèi)AI生態(tài)的事實標(biāo)準(zhǔn)。12.英偉達(dá)發(fā)布Llama3.1NemotronUltra253B,性能?
OpenAI近期推出的全新圖像生成工具引發(fā)了熱潮,用戶使用ChatGPT即可創(chuàng)作出吉卜力等風(fēng)格的AI藝術(shù)作品。這一功能不僅推動了ChatGPT用戶數(shù)的創(chuàng)新高導(dǎo)致服務(wù)器負(fù)擔(dān)過重,甚至一度限制了該功能的使用。SensorTower的數(shù)據(jù)顯示,ChatGPT應(yīng)用的全球下載量和每周活躍用戶數(shù)分別較上周增長了11%和5%應(yīng)用內(nèi)購買收入則增加了6%。
歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、智譜發(fā)布Agent產(chǎn)品AutoGLM沉思:首個實現(xiàn)邊想邊干的智能體智譜AI在2025中關(guān)村論壇上發(fā)布了其最新的Agent產(chǎn)品——AutoGLM沉思。公司致力于推動具身智能技術(shù)的發(fā)展,特別是在機(jī)器人領(lǐng)域的創(chuàng)新,標(biāo)志著其在全球市場中的競爭力不斷增強(qiáng)。
更新上線僅三天,ChatGPT-4o的圖像生成功能,就被網(wǎng)友們玩壞了。ChatGPT-4o的圖像生成功能在社交平臺上爆紅,使用需求遠(yuǎn)高于預(yù)期。GPT-4o還能生成圖像中的文字,此前這是圖像生成領(lǐng)域的一大難題。
OpenAI創(chuàng)始人兼CEO薩姆?阿爾特曼直播發(fā)布了GPT-4o圖像生成功能,作為多模態(tài)模型的GPT-4o補(bǔ)齊了圖片生成這一重要拼圖。GPT-4o圖像生成可以遵循指令生成更準(zhǔn)確的圖像,OpenAI還為其掛載了固有知識庫,可以根據(jù)知識庫或上下文幫用戶生成、編輯圖像。文心一言生成的4張圖片之一豆包生成的4張圖片之一目前看來是有些差距。
歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、OpenAI推出全新圖像生成模型,挑戰(zhàn)Google一句話P圖OpenAI最近推出了其最新的GPT-4o模型,集成了先進(jìn)的圖像生成器,展現(xiàn)出顯著的圖像渲染能力和多樣的輸入輸出支持。寶馬的360度全鏈AI戰(zhàn)略將優(yōu)化生產(chǎn)流程,為智能汽車制造提供保障,計劃在2026年量產(chǎn)新車型,賦能AI智能個人助理,帶來自然流暢的用戶互動體驗。
GPTBots.ai,領(lǐng)先的企業(yè)級AI智能體平臺,近日宣布將DeepSeek的Janus-Pro作為開放工具集成至其生態(tài)系統(tǒng)中,進(jìn)一步擴(kuò)展其全面的AI能力。此次集成緊跟在DeepSeekR1大語言模型加入之后,進(jìn)一步強(qiáng)化了GPTBots.ai在為企業(yè)提供尖端AI解決方案領(lǐng)域的領(lǐng)先地位。憑借與各種系統(tǒng)的無縫集成以及對可擴(kuò)展、安全部署的支持,GPTBots致力于降低成本、加速增長,并幫助企業(yè)在AI時代中蓬勃發(fā)展。