歡迎來到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。
新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/
1、阿里發(fā)布多模態(tài)推理模型QVQ-72B!視覺、語言能力雙提升
阿里巴巴最近推出的QVQ-72B多模態(tài)推理模型在語言和視覺能力上實(shí)現(xiàn)了顯著提升,能夠處理復(fù)雜的推理和分析任務(wù),尤其在多步推理和數(shù)學(xué)推理方面表現(xiàn)突出。該模型的出現(xiàn)標(biāo)志著阿里巴巴在多模態(tài)AI領(lǐng)域的重大突破,提供了新的工具和思路來解決復(fù)雜問題,推動(dòng)各行業(yè)的智能化升級(jí)。
【AiBase提要:】
?? QVQ-72B模型融合了強(qiáng)大的語言和視覺能力,能夠處理復(fù)雜的推理任務(wù)。
?? 在物理和數(shù)學(xué)推理中,該模型通過多步推理顯著提升了準(zhǔn)確率,減少了錯(cuò)誤。
?? QVQ-72B在技術(shù)報(bào)告和圖表分析中具備高效的信息提取能力,為專業(yè)人士提供強(qiáng)大支持。
詳情鏈接:https://huggingface.co/spaces/Qwen/QVQ-72B-preview
2、投資三家機(jī)器人公司后 OpenAI欲自研人形機(jī)器人
OpenAI正在積極探索自研人形機(jī)器人,盡管曾在2021年關(guān)閉機(jī)器人部門。近期,該公司通過投資三家機(jī)器人公司,顯著布局機(jī)器人領(lǐng)域。其旗艦?zāi)P蚈3在AGI測(cè)試中首次超越人類水平,為進(jìn)軍實(shí)體機(jī)器人提供了技術(shù)支持。然而,進(jìn)入這一競(jìng)爭(zhēng)激烈的市場(chǎng),OpenAI可能面臨利益沖突和硬件研發(fā)短板等挑戰(zhàn)。
【AiBase提要:】
?? OpenAI投資三家機(jī)器人公司,積極布局機(jī)器人領(lǐng)域。
?? 旗艦?zāi)P蚈3在AGI測(cè)試中超越人類,技術(shù)優(yōu)勢(shì)明顯。
?? 面臨市場(chǎng)競(jìng)爭(zhēng)和硬件研發(fā)挑戰(zhàn),需快速補(bǔ)齊短板。
3、QQ音樂14.0版本上線,發(fā)布首個(gè)AI大模型音效、智能匹配聽歌音效
QQ音樂14.0版本的推出標(biāo)志著音樂體驗(yàn)的一個(gè)新高度,特別是引入的AI大模型音效。這一創(chuàng)新技術(shù)通過分析音頻特征,為用戶提供個(gè)性化的聽覺體驗(yàn),尤其在3D環(huán)繞音效方面表現(xiàn)出色。此外,伴唱功能的升級(jí)使得用戶可以根據(jù)個(gè)人需求調(diào)節(jié)播放速度和音調(diào),進(jìn)一步增強(qiáng)了音樂互動(dòng)的樂趣。
【AiBase提要:】
?? 新推出的大模型音效通過AI技術(shù)提供個(gè)性化聽覺體驗(yàn),提升音樂的空間感和層次感。
?? 伴唱功能升級(jí),用戶可自由調(diào)節(jié)伴唱模式、播放速度和音調(diào),滿足不同演唱需求。
?? 多款個(gè)性化設(shè)置功能讓用戶選擇不同樣式,享受個(gè)性化的聽歌體驗(yàn)。
4、訊飛星火瀏覽器插件新升級(jí) 新增翻譯總結(jié)、繼續(xù)提問等AI功能
訊飛開放平臺(tái)最近對(duì)其星火瀏覽器插件進(jìn)行了重要升級(jí),顯著提升了用戶的瀏覽體驗(yàn)和工作效率。新功能包括支持多語言的全局翻譯、增強(qiáng)的網(wǎng)頁總結(jié)能力以及“繼續(xù)提問”功能,使用戶能夠深入討論并獲取更高質(zhì)量的答案。此外,插件還提供了一鍵朗讀功能,幫助用戶提高外語口語水平。
【AiBase提要:】
?? 新增的“繼續(xù)提問”功能允許用戶深入討論,獲取更高質(zhì)量的答案。
?? 實(shí)現(xiàn)網(wǎng)頁全局對(duì)照翻譯,支持12種語言,打破語言障礙,提升閱讀體驗(yàn)。
?? 一鍵朗讀功能幫助用戶提高外語口語水平,增強(qiáng)學(xué)習(xí)效果。
5、字節(jié)開源 Midscene.js:AI驅(qū)動(dòng)的E2E測(cè)試框架迎來突破
隨著人工智能技術(shù)的迅猛發(fā)展,E2E測(cè)試領(lǐng)域正經(jīng)歷著一場(chǎng)創(chuàng)新的革命。字節(jié)跳動(dòng)的web-infra團(tuán)隊(duì)推出的Midscene.js,結(jié)合多模態(tài)大語言模型,極大地簡(jiǎn)化了用戶界面測(cè)試的過程。用戶無需編寫代碼,通過自然語言即可與網(wǎng)頁進(jìn)行交互,提升了測(cè)試效率。
【AiBase提要:】
??? Midscene.js通過自然語言與網(wǎng)頁交互,簡(jiǎn)化了E2E測(cè)試流程。
?? Shortest工具利用AI自動(dòng)生成測(cè)試用例,減少重復(fù)性工作時(shí)間。
?? AI技術(shù)的成熟使得基礎(chǔ)E2E測(cè)試場(chǎng)景的自動(dòng)化水平顯著提升。
詳情鏈接:https://github.com/web-infra-dev/midscene
6、DeepMind項(xiàng)目MegaSaM :輸入普通視頻即可預(yù)估相機(jī)視角和景深
MegaSaM系統(tǒng)的推出標(biāo)志著計(jì)算機(jī)視覺領(lǐng)域的一次重大突破。該系統(tǒng)能夠從普通動(dòng)態(tài)視頻中快速、準(zhǔn)確地估計(jì)相機(jī)參數(shù)和深度圖,克服了傳統(tǒng)技術(shù)在動(dòng)態(tài)場(chǎng)景中的局限性。通過對(duì)深度視覺SLAM框架的創(chuàng)新性修改,MegaSaM在復(fù)雜環(huán)境下的實(shí)時(shí)處理能力顯著提高,實(shí)驗(yàn)結(jié)果顯示其在準(zhǔn)確性和效率上均優(yōu)于以往技術(shù)。
【AiBase提要:】
?? MegaSaM系統(tǒng)能夠從普通動(dòng)態(tài)視頻中快速、準(zhǔn)確地估計(jì)相機(jī)參數(shù)和深度圖。
?? 該技術(shù)克服了傳統(tǒng)方法在動(dòng)態(tài)場(chǎng)景中的不足,適應(yīng)復(fù)雜環(huán)境的實(shí)時(shí)處理。
?? 實(shí)驗(yàn)結(jié)果顯示,MegaSaM在準(zhǔn)確性和運(yùn)行效率上均優(yōu)于以往技術(shù)。
詳情鏈接:https://mega-sam.github.io/#demo
7、字節(jié)TikTok算法負(fù)責(zé)人陳志杰或?qū)㈦x職,投身AI Coding方向創(chuàng)業(yè)
字節(jié)跳動(dòng)的TikTok算法負(fù)責(zé)人陳志杰即將離職,計(jì)劃專注于AI Coding領(lǐng)域的創(chuàng)業(yè)。自2022年加入字節(jié)跳動(dòng)以來,他負(fù)責(zé)TikTok的推薦算法和數(shù)據(jù)科學(xué)團(tuán)隊(duì),之前在百度積累了近九年的技術(shù)經(jīng)驗(yàn)。隨著AI Coding市場(chǎng)的快速發(fā)展,預(yù)計(jì)到2032年將超過295億美元,吸引了眾多投資者的關(guān)注。
【AiBase提要:】
?? 陳志杰即將離職字節(jié)跳動(dòng),專注于AI Coding創(chuàng)業(yè)。
?? AI Coding市場(chǎng)前景廣闊,預(yù)計(jì)到2032年將超295億美元。
?? 國內(nèi)市場(chǎng)投資人關(guān)注AI Coding,多個(gè)項(xiàng)目相繼涌現(xiàn)。
8、Fireworks AI推出文檔解析神器!AI輕松讀懂復(fù)雜文件
Fireworks AI最近推出了“Document Inlining”功能,旨在解決處理非結(jié)構(gòu)化文檔的難題。該功能能夠?qū)DF、截圖和圖像等文檔轉(zhuǎn)化為大語言模型可理解的結(jié)構(gòu)化文本,顯著提高了AI處理文檔的效率和準(zhǔn)確性。其核心在于強(qiáng)大的復(fù)合AI系統(tǒng),能夠自動(dòng)識(shí)別和解析多種內(nèi)容,操作簡(jiǎn)單且兼容OpenAI API,用戶無需額外學(xué)習(xí)成本。
【AiBase提要:】
?? 高質(zhì)量輸出: Document Inlining提供的文本質(zhì)量?jī)?yōu)于傳統(tǒng)文本型LLM輸出,尤其在推理和生成任務(wù)中表現(xiàn)出色。
?? 多種文檔格式支持: 該工具支持PDF、圖片等多種格式,能夠準(zhǔn)確提取復(fù)雜文檔中的關(guān)鍵信息。
?? 復(fù)雜文檔解析能力: 能夠解析含有表格和圖表的復(fù)雜文檔,并將其轉(zhuǎn)換為LLM可理解的文本。
詳情鏈接:https://fireworks.ai/blog/document-inlining-launch#quality-evaluation
9、果然最強(qiáng)!OpenAI 新模型o3在ARC-AGI基準(zhǔn)測(cè)試得分破紀(jì)錄
OpenAI最新發(fā)布的模型o3在ARC-AGI基準(zhǔn)測(cè)試中取得了顯著成績(jī),標(biāo)準(zhǔn)計(jì)算條件下得分75.7%,高計(jì)算版本更是達(dá)到87.5%。盡管這一成就震驚了AI研究界,但專家指出o3仍未達(dá)到通用人工智能(AGI)的標(biāo)準(zhǔn)。o3的計(jì)算成本高昂,解決每個(gè)謎題需17至20美元,且在某些簡(jiǎn)單任務(wù)上表現(xiàn)不佳。
【AiBase提要:】
?? o3在ARC-AGI基準(zhǔn)測(cè)試中獲得75.7%的高分,表現(xiàn)超越以往模型。
?? o3解決每個(gè)謎題的成本高達(dá)17到20美元,計(jì)算量巨大。
?? 盡管o3表現(xiàn)優(yōu)秀,但專家們強(qiáng)調(diào)其尚未達(dá)到AGI的標(biāo)準(zhǔn)。
10、打錯(cuò)字也能 “越獄”GPT-4o、Claude:揭秘AI聊天機(jī)器人的脆弱性!
最近的研究揭示了先進(jìn)AI聊天機(jī)器人在面對(duì)簡(jiǎn)單拼寫錯(cuò)誤時(shí)的脆弱性。通過一種名為“最佳選擇(Best-of-N,BoN)越獄”的算法,研究人員發(fā)現(xiàn),故意加入拼寫錯(cuò)誤可以讓這些模型忽視安全防護(hù),生成本應(yīng)拒絕的內(nèi)容。這一發(fā)現(xiàn)不僅突顯了AI與人類價(jià)值觀對(duì)齊的困難,也表明即使是高級(jí)AI系統(tǒng)也容易受到欺騙。
【AiBase提要:】
?? 研究發(fā)現(xiàn),通過拼寫錯(cuò)誤等簡(jiǎn)單技巧,AI聊天機(jī)器人可被輕易 “越獄”。
?? BoN越獄技術(shù)在多種AI模型中成功率達(dá)52%,有些甚至高達(dá)89%。
?? 此技術(shù)在音頻和圖像輸入中同樣有效,顯示出AI的脆弱性。
11、尷尬!谷歌被曝用Claude模型進(jìn)行對(duì)比測(cè)試來改進(jìn)Gemini AI
近日,谷歌的Gemini人工智能項(xiàng)目正在通過與Anthropic公司的Claude模型進(jìn)行對(duì)比測(cè)試,以提升自身的性能。負(fù)責(zé)Gemini改進(jìn)的承包商正在評(píng)估這兩種模型的輸出,比較的標(biāo)準(zhǔn)包括真實(shí)性和安全性。盡管谷歌是Anthropic的主要投資者之一,但谷歌發(fā)言人表示并未對(duì)Gemini進(jìn)行Claude模型的訓(xùn)練。
【AiBase提要:】
?? Gemini正在與Claude進(jìn)行對(duì)比測(cè)試,以提升自身AI模型的性能。
?? 承包商負(fù)責(zé)評(píng)分,兩者的回答比較涉及多個(gè)標(biāo)準(zhǔn),包括真實(shí)性和安全性。
?? Anthropic禁止在未授權(quán)的情況下使用Claude進(jìn)行競(jìng)爭(zhēng)性模型的訓(xùn)練。
12、研究發(fā)現(xiàn),OpenAI 的 o1-preview 在診斷復(fù)雜醫(yī)療病例方面優(yōu)于醫(yī)生
一項(xiàng)新研究表明,OpenAI 的 o1-preview 人工智能系統(tǒng)在復(fù)雜醫(yī)療案例的診斷上表現(xiàn)優(yōu)于人類醫(yī)生,達(dá)到了88.6%的準(zhǔn)確率。該系統(tǒng)在醫(yī)療推理方面同樣出色,獲得了80個(gè)病例中78個(gè)滿分。盡管o1-preview在某些方面表現(xiàn)優(yōu)秀,但在實(shí)際應(yīng)用中仍面臨高成本和不切實(shí)際的測(cè)試建議等問題。
【AiBase提要:】
?? o1-preview 在診斷率上超過醫(yī)生,達(dá)到88.6%的準(zhǔn)確率。
?? 醫(yī)療推理方面,o1-preview 在80個(gè)病例中獲得78個(gè)滿分,遠(yuǎn)超醫(yī)生表現(xiàn)。
?? 盡管表現(xiàn)優(yōu)秀,o1-preview 在實(shí)際應(yīng)用中的高成本和不切實(shí)際的測(cè)試建議仍需解決。
詳情鏈接:https://arxiv.org/abs/2412.10849
(舉報(bào))