11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個(gè)月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享??靵?lái)騰訊云選購(gòu)吧!
最近的研究表明,GPT-4在圖形推理任務(wù)上表現(xiàn)不佳,僅有33%的準(zhǔn)確率,引發(fā)了對(duì)大型語(yǔ)言模型圖形處理能力的關(guān)注。通過(guò)使用ConceptARC數(shù)據(jù)集,研究者對(duì)451名人類受試者進(jìn)行了圖形推理任務(wù)測(cè)試,結(jié)果顯示人類在這方面表現(xiàn)卓越,平均準(zhǔn)確率達(dá)到91%。這項(xiàng)研究突顯了目前大型語(yǔ)言模型在某些特定任務(wù)上的局限性,并提出了對(duì)研究方法的進(jìn)一步審視的需求。