中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

<td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>

<rp id="h1kkc"></rp>

<button id="ryoox"></button>

<span id="ryoox"><ins id="ryoox"><output id="ryoox"></output></ins></span>

研究表明：GPT-4在圖形推理任務(wù)上表現(xiàn)不佳，準(zhǔn)確率僅33%

2023-11-21 16:49 · 稿源：站長之家

要點(diǎn):
美國圣塔菲研究所的研究顯示，GPT-4在圖形推理任務(wù)上的準(zhǔn)確率僅為33%，而多模態(tài)版本GPT-4v的表現(xiàn)更差，只有25%。
通過使用ConceptARC數(shù)據(jù)集，作者對(duì)451名人類受試者進(jìn)行了圖形推理任務(wù)測(cè)試，結(jié)果顯示人類的平均正確率為91%，遠(yuǎn)高于GPT-4。
研究者招募受試者的方式和GPT-4的輸入方式引發(fā)了質(zhì)疑，包括入門測(cè)試不足以篩選高質(zhì)量受試者，樣本的隨機(jī)性受到爭(zhēng)議，以及圖像轉(zhuǎn)換為數(shù)字矩陣可能改變概念等。

站長之家（ChinaZ.com）11月21日消息:最近的研究表明，GPT-4在圖形推理任務(wù)上表現(xiàn)不佳，僅有33%的準(zhǔn)確率，引發(fā)了對(duì)大型語言模型圖形處理能力的關(guān)注。

通過使用ConceptARC數(shù)據(jù)集，研究者對(duì)451名人類受試者進(jìn)行了圖形推理任務(wù)測(cè)試，結(jié)果顯示人類在這方面表現(xiàn)卓越，平均準(zhǔn)確率達(dá)到91%。

論文地址:https://arxiv.org/pdf/2305.07141.pdf

多模態(tài)版本GPT-4v的表現(xiàn)更差，只有25%的準(zhǔn)確率。這凸顯了在涉及圖形處理的任務(wù)中，大型語言模型的多模態(tài)能力也受到限制。

研究者使用ConceptARC數(shù)據(jù)集進(jìn)行測(cè)試，其中包括16個(gè)子類的圖形推理題，涵蓋了位置關(guān)系、形狀、操作、比較等多個(gè)方面的內(nèi)容。

然而，這項(xiàng)研究的方法引發(fā)了一些質(zhì)疑，包括受試者招募的方式和GPT-4的輸入方式。研究者在亞馬遜眾包平臺(tái)上招募受試者，入門測(cè)試被認(rèn)為不足以篩選高質(zhì)量的受試者，樣本的隨機(jī)性受到爭(zhēng)議。

此外，GPT-4的輸入方式也引發(fā)了一些爭(zhēng)議，特別是將圖像轉(zhuǎn)換為數(shù)字矩陣可能改變概念，這使得一些人對(duì)實(shí)驗(yàn)結(jié)果的可信度產(chǎn)生疑問。綜合而言，這項(xiàng)研究突顯了目前大型語言模型在某些特定任務(wù)上的局限性，并提出了對(duì)研究方法的進(jìn)一步審視的需求。

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

GPT

研究表明：長期與AI聊天，會(huì)增加孤獨(dú)感！

AI 的便利性和實(shí)用性源于它與人類的互動(dòng)。然而，過度依賴也可能會(huì)變成一味毒藥。這就是為何我們要對(duì) AI 公司們提出更加嚴(yán)格的倫理責(zé)任要求的原因……

?AI聊天機(jī)器人 ?AI倫理 ?AI大模型
紫東太初多模態(tài)RAG全新發(fā)布：端到端問答準(zhǔn)確率提升33%

在產(chǎn)業(yè)智能化進(jìn)程中，如何高效融合企業(yè)專有知識(shí)資產(chǎn)，構(gòu)建領(lǐng)域?qū)僬J(rèn)知引擎，是企業(yè)邁向智能決策與高效運(yùn)營的關(guān)鍵。然而，傳統(tǒng)檢索增強(qiáng)生成(RAG)技術(shù)受限于語言單模態(tài)處理能力，僅能實(shí)現(xiàn)文本知識(shí)庫與文本查詢之間的淺層理解，難以滿足復(fù)雜業(yè)務(wù)場(chǎng)景的需求，在實(shí)際應(yīng)用中暴露出兩大缺陷:信息表征缺失:忽略知識(shí)庫中多模態(tài)富文檔的視覺語義信息，如版面結(jié)構(gòu)、圖表關(guān)?

?產(chǎn)業(yè)智能化 ?企業(yè)知識(shí)資產(chǎn) ?多模態(tài)檢索
重磅！OpenAI確定GPT-4退役日期：4月30日

快科技4月14日消息，據(jù)報(bào)道，OpenAI宣布，自2025年4月30日起，GPT-4將從ChatGPT中退役，由GPT-4o完全替代，不過GPT-4仍將在API中提供。OpenAI表示，在面對(duì)面的評(píng)估中，GPT-4o在寫作、編碼、STEM等方面持續(xù)超越GPT-4。最近的升級(jí)進(jìn)一步改進(jìn)了GPT-4o的指令跟蹤、問題解決和對(duì)話流程，使其成為GPT-4的自然繼承者。據(jù)悉，GPT-4于2023年3月發(fā)布，較上一代GPT-3.5有了顯著提升。而GPT-4o是OpenAI為聊天

?OpenAI ?GPT-4 ?GPT-4o
薦生成很強(qiáng)，推理很弱：GPT-4o的視覺短板

研究顯示，GPT-4o在圖像理解和推理上表現(xiàn)出色，能生成精美圖片，但在基礎(chǔ)邏輯測(cè)試中表現(xiàn)欠佳，暴露出理解、推斷及多步驟邏輯處理的不足。例如，被要求畫一只貓時(shí)，它先畫了狗然后改為貓，但仍存在錯(cuò)誤判斷。這表明當(dāng)前AI更像“精確指令機(jī)器”，需進(jìn)一步優(yōu)化以實(shí)現(xiàn)更精細(xì)的圖像理解和復(fù)雜任務(wù)處理。

?AI畫圖 ?GPT-4o ?圖像理解
GPT-4退役，但，OpenAI接下來準(zhǔn)備了“很多好消息”！

OpenAI 的重大調(diào)整仍在繼續(xù)。

?OpenAI ?GPT-4 ?自然語言處理
聯(lián)發(fā)科天璣9400+拿下最強(qiáng)AI手機(jī)芯片：端側(cè)推理準(zhǔn)確率反超云端大模型

今日，聯(lián)發(fā)科舉辦天璣開發(fā)者大會(huì)2025，正式發(fā)布新一代旗艦芯片天璣9400。天璣9400定位旗艦5G智能體AI芯片，綜合AI跑分是天璣9400的1.25倍，支持最高8B規(guī)模的DeepSeek-R1端測(cè)部署，推理準(zhǔn)確率反超云端大模型。天璣9400采用臺(tái)積電第二代3nm工藝，CPU架構(gòu)延續(xù)創(chuàng)新全大核設(shè)計(jì)，包含1顆主頻3.7GHz的Cortex-X925超大核、3顆3.3GHz的Cortex-X4大核與4顆2.4GHz的Cortex-A720大核。

?天璣9400 ?聯(lián)發(fā)科 ?5G智能芯片
首款支持原生級(jí)120幀的小屏旗艦！一加13T攻克原生GPU圖形技術(shù)

快科技4月17日消息，一加中國區(qū)總裁李杰介紹，一加13T不僅實(shí)現(xiàn)小屏首個(gè)原生級(jí)120幀，更是行業(yè)首個(gè)做到《大型開放世界手游》原生級(jí)120幀 1.5K畫質(zhì)滿血同開，相比此前的60幀 810p，一加13T算是當(dāng)下最滿配”的游戲體驗(yàn)了，大屏手機(jī)都做不到的，小屏大魔王可以。這都得益于一加獨(dú)家自研的風(fēng)馳游戲內(nèi)核，我們率先攻克了原生GPU圖形技術(shù)，在游戲體驗(yàn)上完勝外掛獨(dú)顯芯片的插幀?

?一加13T ?小屏手機(jī) ?游戲體驗(yàn)
薦被吹爆的GPT-4o真有那么強(qiáng)？這有23個(gè)案例實(shí)測(cè)

距離OpenAI正式發(fā)布GPT-4o生圖功能，已經(jīng)過去兩周多了。這段時(shí)間里，“ChatGPT-4o顛覆了AI圖像生成的邏輯”這句話大家應(yīng)該都聽膩了?，F(xiàn)在早上一睜眼，先看有沒有更新，看看自己有沒有落后。

?AI圖像生成 ?GPT-4o功能 ?電商產(chǎn)品主圖
暗影騎士·擎7系列首秀，與行業(yè)大咖一起見證50系A(chǔ)I戰(zhàn)神頂級(jí)表現(xiàn)！

宏碁攜全網(wǎng)最會(huì)搞事的硬核電腦玩家——搞機(jī)所一同開啟炸裂直播，全面評(píng)測(cè)全新暗影騎士?擎7系列的強(qiáng)悍性能。如此強(qiáng)大的暗影騎士?擎7系列新品引起無數(shù)玩家的高度關(guān)注，今晚B站搞機(jī)所直播間，共同見證暗影騎士?擎7系列的超神表現(xiàn)，與宏碁一起“搞機(jī)”，玩轉(zhuǎn)AI新未來！

?宏碁 ?暗影騎士 ?電競(jìng)體驗(yàn)
薦挑戰(zhàn)GPT-4o！AI文生圖驚現(xiàn)黑馬，國產(chǎn)團(tuán)隊(duì)HiDream如何逆襲？

HiDream是一款由國內(nèi)團(tuán)隊(duì)開發(fā)的AI模型，擅長生成復(fù)雜的圖片與多種風(fēng)格的藝術(shù)作品。它在多個(gè)測(cè)試中表現(xiàn)出對(duì)細(xì)節(jié)、材質(zhì)、光影控制以及創(chuàng)意概念的良好理解，尤其在人物動(dòng)態(tài)、精細(xì)繪畫等方面效果顯著。HiDream支持輸出4K高清圖片，并兼容多種應(yīng)用領(lǐng)域，包括商業(yè)用途。盡管在某些特定要求下還需提升表現(xiàn)，但其潛力和實(shí)際效果已受到關(guān)注。

?AI技術(shù) ?文生圖 ?開源模型

熱文

3 天
7天

站長商機(jī)

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM