11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個(gè)月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享??靵眚v訊云選購吧!
MetaAI研究人員今天發(fā)布了OpenEQA,這是一個(gè)新的開源基準(zhǔn)數(shù)據(jù)集,旨在衡量人工智能系統(tǒng)對(duì)“體驗(yàn)式問答”的能力——這種能力使人工智能系統(tǒng)能夠理解現(xiàn)實(shí)世界,從回答有關(guān)環(huán)境的自然語言問題。這一數(shù)據(jù)集被Meta定位為“體驗(yàn)智能”領(lǐng)域的關(guān)鍵基準(zhǔn),其中包含超過1,600個(gè)關(guān)于180多個(gè)真實(shí)環(huán)境的問題。為了衡量人工智能代理的性能,研究人員使用大型語言模型自動(dòng)評(píng)分,衡量人工智能生成的答案與人類答案的相似程度。