多模態(tài)大模型在聽覺上,居然也出現(xiàn)了「9.119.8」的現(xiàn)象,音量大小這種簡單問題都識別不了!港中文、斯坦福等大學聯(lián)合發(fā)布的AV-Odyssey基準測試,包含26個視聽任務,覆蓋了7種聲音屬性,跨越了10個不同領域,確保測試的深度和廣度。在人工智能領域,我們一直以為頂尖的多模態(tài)大模型已
......
本文由站長之家合作伙伴自媒體作者“新智元公眾號”授權(quán)發(fā)布于站長之家平臺,本平臺僅提供信息索引服務。由于內(nèi)容發(fā)布時間超過平臺更新維護時間,為了保證文章信息的及時性,內(nèi)容觀點的準確性,平臺將不提供完全的內(nèi)容展現(xiàn),本頁面內(nèi)容僅為平臺搜索索引使用。需閱讀完整內(nèi)容的用戶,請查看原文,獲取內(nèi)容詳情。
(舉報)