歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。
新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/
1、百川智能發(fā)布全場景深度思考模型Baichuan-M1-preview 已在百小應(yīng)上線
百川公司今日推出了Baichuan-M1系列模型,其中包括全場景深度思考模型Baichuan-M1-preview和開源醫(yī)療增強大模型Baichuan-M1-14B。這兩款模型在技術(shù)創(chuàng)新和性能上均表現(xiàn)出色,尤其是Baichuan-M1-preview在多個權(quán)威評測中超越了競爭對手,展現(xiàn)出強大的深度思考能力和醫(yī)療循證模式,為醫(yī)療領(lǐng)域的應(yīng)用提供了強有力的支持。
【AiBase提要:】
?? Baichuan-M1-preview是國內(nèi)首個具備語言、視覺和搜索推理能力的模型,表現(xiàn)優(yōu)異。
?? Baichuan-M1-14B在醫(yī)學(xué)知識和臨床能力評測中超越了更大參數(shù)量的模型,醫(yī)療能力強大。
?? 百川公司通過開源Baichuan-M1-14B,旨在激發(fā)創(chuàng)新力量,推動醫(yī)療技術(shù)的廣泛應(yīng)用。
2、OpenAI發(fā)布首個AI智能體Operator,首批面向ChatGPT Pro用戶
OpenAI最新推出的AI代理Operator旨在幫助用戶在網(wǎng)絡(luò)上執(zhí)行多種任務(wù),初步面向ChatGPT Pro用戶。該工具結(jié)合了先進的視覺能力和強化學(xué)習(xí),能夠與網(wǎng)頁進行交互并具備自我糾正功能。Operator在設(shè)計上注重安全性,確保用戶在處理敏感信息時能保持控制。
【AiBase提要:】
?? OpenAI 推出 “Operator” AI 智能體,幫助用戶在線執(zhí)行任務(wù),首批面向 ChatGPT Pro 用戶。
??? Operator 可以通過瀏覽器與網(wǎng)頁交互,具備自我糾正和用戶控制的功能,確保安全性。
?? OpenAI 與多個知名公司合作,致力于滿足現(xiàn)實需求,同時計劃未來擴展至更多用戶。
詳情鏈接:https://openai.com/index/introducing-operator/
3、HeyGen推出數(shù)字人運動控制功能 能彈樂器還能跳舞
HeyGen最新發(fā)布的數(shù)字人運動控制系統(tǒng)實現(xiàn)了虛擬形象的大幅度肢體動作操控。這項技術(shù)突破使得數(shù)字人不僅能夠完成基礎(chǔ)的微表情,更能流暢地執(zhí)行復(fù)雜的肢體動作,如彈奏樂器和舞蹈表演。通過引入運動學(xué)控制算法,動作響應(yīng)延遲降低至12毫秒,極大提升了視頻制作效率。
【AiBase提要:】
?? HeyGen的數(shù)字人運動控制系統(tǒng)實現(xiàn)了虛擬形象的復(fù)雜肢體動作操控,能夠流暢執(zhí)行彈奏樂器和舞蹈表演。
?? 該系統(tǒng)通過深度神經(jīng)網(wǎng)絡(luò)生成虛擬形象,支持實時生成超過200個關(guān)節(jié)點位數(shù)據(jù),展現(xiàn)類生物力學(xué)特征。
?? 視頻制作效率提升約47%,動態(tài)場景制作成本降低至傳統(tǒng)方式的1/8,未來將整合觸覺反饋模擬。
詳情鏈接:https://app.heygen.com/
4、Perplexity 推出Android移動助手 可寫電子郵件、預(yù)訂晚餐
Perplexity最近推出了一款新的AI助手,專為Android用戶設(shè)計,能夠執(zhí)行多種任務(wù),如撰寫電子郵件、設(shè)置提醒和預(yù)訂晚餐。該助手具備多模態(tài)功能,能夠識別屏幕內(nèi)容和通過相機識別周圍事物,提升了用戶的操作便利性。在實際體驗中,助手的反應(yīng)速度和準(zhǔn)確性都令人印象深刻,雖然目前仍在擴展支持的應(yīng)用程序和功能,但其潛力已顯而易見。
【AiBase提要:】
?? 助手支持撰寫郵件、設(shè)置提醒和預(yù)訂餐廳等多種功能。
?? 具備多模態(tài)功能,能夠識別屏幕內(nèi)容和通過相機識別周圍事物。
?? 目前支持Spotify、YouTube和Uber等應(yīng)用,功能仍在不斷擴展中。
5、元象推出智能數(shù)字人平臺「元象日播」
深圳元象信息科技有限公司推出的智能數(shù)字人平臺“元象日播”以其高自然度的定制能力和實時交互功能,為品牌展示和內(nèi)容生產(chǎn)提供了創(chuàng)新解決方案。該平臺的集成工具使用戶能夠快速搭建直播空間,并通過自研大模型實現(xiàn)觀眾互動,顯著提升用戶體驗。
【AiBase提要:】
?? 元象日播平臺提供一站式直播工具,用戶可快速搭建專業(yè)直播空間。
??? 通過音色克隆技術(shù),用戶可輕松定制個性化的數(shù)字人形象和聲音。
?? 該平臺已在多個行業(yè)廣泛應(yīng)用,顯著提高了客戶的銷售轉(zhuǎn)化率。
6、300倍體積縮減!Hugging Face推SmolVLM模型:小巧智能,手機也能跑
Hugging Face推出的SmolVLM模型以其小巧的體積和卓越的性能,引領(lǐng)了AI技術(shù)的新潮流。該模型不僅能在手機等小型設(shè)備上運行,其性能更是超越了需要大型數(shù)據(jù)中心支持的前輩模型Idefics80B,標(biāo)志著實用AI部署的重大進展。
【AiBase提要:】
?? SmolVLM模型能在手機上運行,性能超越300倍大的Idefics80B模型。
?? SmolVLM模型幫助企業(yè)顯著降低計算成本,處理速度達到每秒16個實例。
?? 該模型的技術(shù)創(chuàng)新讓小型企業(yè)和初創(chuàng)公司能夠在短時間內(nèi)推出復(fù)雜的計算機視覺產(chǎn)品。
詳情鏈接:https://huggingface.co/blog/smolervlm
7、中國聯(lián)通發(fā)布元景思維鏈大模型:性能超越GPT-4
中國聯(lián)通近日推出了元景思維鏈大模型,標(biāo)志著其在人工智能領(lǐng)域的重要進展。這款央企開源的通用思維鏈大模型展現(xiàn)了卓越的慢思考能力和多場景推理能力,其性能在多個測評中超越了目前最好的通用語言模型,如OpenAI的GPT-4。
【AiBase提要:】
?? 元景思維鏈大模型是中國聯(lián)通首款央企開源的通用思維鏈大模型,具有強大的慢思考和推理能力。
?? 在主流榜單測評中,該模型表現(xiàn)超越了OpenAI GPT-4和其他頂尖語言模型,顯示出其競爭力。
?? 模型實現(xiàn)了任務(wù)和難度自適應(yīng),提升了回答效率和準(zhǔn)確性,已成功應(yīng)用于多個領(lǐng)域。
詳情鏈接:https://github.com/UnicomAI/Unichat-32B-c1.git
8、發(fā)燒友!一國外軟件工程師買下OGOpenAI.com域名并重定向至DeepSeek
最近,軟件工程師安納奈?阿羅拉以極低的價格購買了域名OGOpenAI.com,并將其重定向至中國AI實驗室DeepSeek。DeepSeek在開源AI領(lǐng)域的突破性進展引發(fā)了廣泛關(guān)注,其AI模型在某些基準(zhǔn)測試中表現(xiàn)優(yōu)于OpenAI的o1模型。與此形成對比的是,OpenAI在發(fā)布強大模型時顯得相對謹(jǐn)慎,面臨來自行業(yè)的批評。
【AiBase提要:】
?? 安納奈?阿羅拉購買OGOpenAI.com域名,并重定向至DeepSeek。
?? DeepSeek的AI模型在某些基準(zhǔn)測試中表現(xiàn)優(yōu)于OpenAI的o1模型。
?? OpenAI因未能發(fā)布強大模型而受到批評,面臨來自行業(yè)的質(zhì)疑。
9、OpenAI CEO宣布ChatGPT免費版將引入o3-mini,效率翻倍!
OpenAI首席執(zhí)行官山姆·奧特曼宣布,ChatGPT的免費版將升級為全新的o3-mini模型,旨在提升用戶體驗并滿足日常需求。付費用戶將獲得更多使用機會,增強生產(chǎn)力。此舉不僅推動了人工智能的民主化,也為數(shù)百萬用戶提供了前沿技術(shù)的接入,同時確保了付費用戶的價值體驗。
【AiBase提要:】
?? 免費用戶將享受到新升級的o3-mini模型,提供更快的響應(yīng)速度。
?? 付費用戶將獲得更多的o3-mini使用機會,提升生產(chǎn)力。
?? OpenAI致力于推動人工智能的民主化,確保更多用戶享受前沿技術(shù)。
(舉報)