歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。
新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/
1、Moonshot AI發(fā)布Kimi-Audio:開源音頻基礎(chǔ)模型樹立新標(biāo)桿
Moonshot AI最近推出的Kimi-Audio是一款開源音頻基礎(chǔ)模型,旨在推動音頻理解、生成和交互技術(shù)的發(fā)展。該模型基于Qwen2.5-7B架構(gòu),結(jié)合Whisper技術(shù),支持多種音頻任務(wù),如語音識別和音頻問答。憑借超過13億小時的多樣化音頻數(shù)據(jù)訓(xùn)練,Kimi-Audio在多項基準(zhǔn)測試中表現(xiàn)出色,超越了現(xiàn)有模型。
【AiBase提要:】
?? Kimi-Audio具備強大的多功能音頻處理能力,支持語音識別、音頻問答等多項任務(wù)。
?? 該模型在超過13億小時的多樣化音頻數(shù)據(jù)上進(jìn)行訓(xùn)練,展現(xiàn)了卓越的性能表現(xiàn)。
?? Kimi-Audio的開源策略降低了音頻AI技術(shù)的使用門檻,促進(jìn)了全球AI技術(shù)的民主化進(jìn)程。
詳情鏈接:https://github.com/MoonshotAI/Kimi-Audio
2、階躍星辰開源圖像生成模型Step1X-Edit:開源圖像編輯新標(biāo)桿
Step1X-Edit是由Stepfun AI團(tuán)隊推出的開源圖像編輯模型,結(jié)合了多模態(tài)大語言模型與擴散變換器,展現(xiàn)出強大的圖像生成能力。其開源特性和高性能表現(xiàn)吸引了業(yè)界的廣泛關(guān)注,尤其是在GEdit-Bench基準(zhǔn)測試中表現(xiàn)優(yōu)異。該模型為內(nèi)容創(chuàng)作者和開發(fā)者提供了強大的工具,推動了圖像編輯技術(shù)的發(fā)展。
【AiBase提要:】
??: Step1X-Edit結(jié)合多模態(tài)大語言模型與擴散變換器,能高效生成高質(zhì)量圖像。
??: GEdit-Bench基準(zhǔn)測試顯示其性能超越現(xiàn)有開源模型,接近閉源模型水平。
??: 開源特性為研究和開發(fā)提供了基礎(chǔ),推動了圖像編輯技術(shù)的創(chuàng)新與普及。
詳情鏈接:https://huggingface.co/spaces/stepfun-ai/Step1X-Edit
3、夸克AI超級框升級 上線“拍照問夸克”功能:啥都能答
阿里巴巴旗下的夸克AI超級框于4月25日推出了“拍照問夸克”功能,這一創(chuàng)新利用視覺理解和推理模型,能夠快速識別和理解用戶在現(xiàn)實生活中遇到的各種問題。用戶通過拍照可以獲取準(zhǔn)確的信息和答案,涵蓋多個領(lǐng)域,包括文物講解、商品識別、健康分析等。
【AiBase提要:】
?? 新功能“拍照問夸克”基于視覺理解,能快速識別圖片中的內(nèi)容并提供相關(guān)信息。
?? 用戶可以通過上傳商品圖片直接跳轉(zhuǎn)到淘寶同款鏈接,提升購物體驗。
?? 該功能支持多種語言提問和翻譯,適用于旅行、健康、工作等多個場景。
4、國行版蘋果AI智能要來了?iOS18.5正式版預(yù)計5月份推送
蘋果公司即將在5月向中國用戶推送iOS18.5正式版更新,帶來備受關(guān)注的Apple智能功能。這一功能已在其他地區(qū)上線,中國用戶等待了近一個月。Apple智能是一套基于個人場景的AI系統(tǒng),提供多樣化服務(wù),包括照片消除和智能回復(fù)等。然而,只有iPhone15Pro系列及即將發(fā)布的iPhone16全系機型支持該功能,且用戶需確保設(shè)備有足夠的存儲空間。
【AiBase提要:】
?? Apple智能功能將于5月正式推送給中國用戶,標(biāo)志著蘋果進(jìn)入生成式AI時代。
?? 該功能包括照片消除、通知摘要和智能回復(fù)等多樣化服務(wù),但僅支持iPhone15Pro及以上機型。
?? 用戶需確保設(shè)備至少有7GB可用存儲空間,這對部分用戶的存儲管理可能帶來挑戰(zhàn)。
5、谷歌AI發(fā)布601個真實世界的生成式AI應(yīng)用案例,涵蓋各行業(yè)
谷歌云最近發(fā)布了一份報告,展示了601個來自全球頂尖企業(yè)的生成式AI應(yīng)用案例,顯示出這一技術(shù)的快速發(fā)展和廣泛應(yīng)用。相比去年僅有的101個案例,增長了六倍,涵蓋了汽車、金融、醫(yī)療等多個行業(yè)。這些案例不僅突顯了生成式AI在運營和戰(zhàn)略中的重要性,還展示了其作為組織結(jié)構(gòu)一部分的潛力。
【AiBase提要:】
??601個生成式AI應(yīng)用案例展示了技術(shù)在各行業(yè)的廣泛應(yīng)用,較去年增長六倍。
?? AI代理分類清晰,展示了AI在客戶服務(wù)、內(nèi)部生產(chǎn)力和安全等方面的多重角色。
?? 各行業(yè)的實際應(yīng)用案例凸顯了生成式AI從實驗走向生產(chǎn)的重要趨勢。
詳情鏈接:https://cloud.google.com/transform/101-real-world-generative-ai-use-cases-from-industry-leaders
6、微軟發(fā)布全新Agent操作系統(tǒng)UFO2 ,深度整合Windows與智能自動化
微軟近期推出的UFO2版本在自動化領(lǐng)域帶來了顯著進(jìn)步,特別是在與Windows系統(tǒng)的深度集成方面。新版本能夠直接調(diào)用Windows的原生API,極大提升了自動化任務(wù)的執(zhí)行效率。與OpenAI的Operator相比,UFO2在多個測試場景中的成功率明顯更高,尤其在處理復(fù)雜任務(wù)和跨應(yīng)用操作時表現(xiàn)出色。
【AiBase提要:】
?? UFO2與Windows系統(tǒng)深度集成,能直接調(diào)用原生API,提升自動化效率。
?? UFO2的自動化任務(wù)成功率顯著高于OpenAI的Operator,表現(xiàn)出色。
??? 新增的畫中畫模式實現(xiàn)自動化任務(wù)與用戶操作的隔離,提升用戶體驗。
詳情鏈接:https://github.com/microsoft/UFO?tab=readme-ov-file
7、OpenAI 推出 ChatGPT 新版本:更智能、更直觀的 GPT-4o
OpenAI 最近對其 ChatGPT 的 GPT-4o 版本進(jìn)行了重要更新,重點在于如何更好地保存記憶以及提升在科學(xué)、技術(shù)、工程和數(shù)學(xué)(STEM)領(lǐng)域的技能。新版本旨在引導(dǎo)對話更有效地朝著富有成效的結(jié)果發(fā)展,同時提升模型的智能水平和人格特質(zhì)。盡管存在某些“光滑”過度的問題,OpenAI 承諾未來將進(jìn)行改進(jìn)。此外,開發(fā)者可以選擇新的 GPT-4.1系列,以獲得更穩(wěn)定的 API 體驗。
【AiBase提要:】
?? 更新的 GPT-4o 版本在記憶保存和 STEM 技能方面進(jìn)行了優(yōu)化。
?? OpenAI 承認(rèn)模型在某些情況下存在 “光滑” 過度的問題,未來將改進(jìn)。
?? 開發(fā)者可選擇新推出的 GPT-4.1系列,以獲得更穩(wěn)定的 API 體驗。
8、Ema推新型語言模型EmaFusion:成本和準(zhǔn)確性方面擊敗了 O3、Gemini
Ema公司推出了新型語言模型EmaFusion,聲稱在成本和準(zhǔn)確性上超越了多款知名AI模型。EmaFusion采用“級聯(lián)”判斷系統(tǒng),能夠動態(tài)平衡成本與準(zhǔn)確性,并允許用戶根據(jù)任務(wù)需求進(jìn)行微調(diào)。其準(zhǔn)確率達(dá)到94.3%,運行成本顯著降低,成為企業(yè)AI發(fā)展的新選擇。
【AiBase提要:】
?? EmaFusion 的準(zhǔn)確率達(dá)到94.3%,成本是市場平均水平的四分之一。
?? EmaFusion 能夠智能拆解復(fù)雜任務(wù),并將其分配給最適合的 AI 模型。
?? Ema 正與 KPMG、Hitachi 等全球領(lǐng)軍企業(yè)合作,推動企業(yè) AI 的發(fā)展。
詳情鏈接:https://www.ema.co/emafusion
9、Liquid AI推出Hyena Edge,開創(chuàng)智能手機邊緣設(shè)備的新時代
Liquid AI近期推出了新型卷積模型Hyena Edge,旨在為智能手機及邊緣設(shè)備提供更高效的人工智能解決方案。該模型在計算效率和內(nèi)存使用上超越了傳統(tǒng)的Transformer++模型,尤其適合資源受限的環(huán)境。Hyena Edge在多個標(biāo)準(zhǔn)語言模型基準(zhǔn)測試中表現(xiàn)出色,展示了自動化架構(gòu)設(shè)計的潛力,并計劃在未來開源,推動技術(shù)普及。
【AiBase提要:】
?? Hyena Edge 是Liquid AI公司推出的新型卷積模型,專為智能手機等邊緣設(shè)備設(shè)計。
?? 該模型在計算效率和內(nèi)存使用上優(yōu)于傳統(tǒng)的 Transformer++ 模型,適合資源受限的環(huán)境。
?? Hyena Edge 在多個標(biāo)準(zhǔn)語言模型基準(zhǔn)測試中表現(xiàn)卓越,并計劃在未來開源以促進(jìn)技術(shù)普及。
詳情鏈接:https://www.liquid.ai/research/convolutional-multi-hybrids-for-edge-devices
10、LemonAI 推出實時音視頻 AI 數(shù)字人模型 Slice Live
LemonAI 最近推出了其創(chuàng)新產(chǎn)品 Slice Live,這是一款全球首創(chuàng)的實時音視頻 AI 模型。用戶只需上傳一張照片,即可與虛擬角色進(jìn)行實時視頻通話。Slice Live 采用先進(jìn)的 Transformer 模型,以每秒25幀的速度渲染每個像素,確保畫面流暢且真實。該產(chǎn)品在娛樂和教育領(lǐng)域都展示了巨大的潛力,未來還將擴展到 AR、VR 和元宇宙應(yīng)用,同時重視用戶隱私和數(shù)據(jù)安全。
【AiBase提要:】
?? 用戶只需上傳一張照片,即可與虛擬角色進(jìn)行實時視頻通話。
?? Slice Live 在娛樂和教育領(lǐng)域提供沉浸式互動體驗,帶來生動的學(xué)習(xí)內(nèi)容。
?? LemonAI 承諾持續(xù)探索隱私保護(hù),確保用戶數(shù)據(jù)安全。
11、智譜與生數(shù)科技達(dá)成戰(zhàn)略合作 專注大模型聯(lián)合創(chuàng)新
4月27日,清華大學(xué)旗下的智譜與生數(shù)科技宣布達(dá)成重大戰(zhàn)略合作,旨在通過雙方在大語言模型和多模態(tài)生成模型的技術(shù)積累,共同推進(jìn)國產(chǎn)大模型的技術(shù)創(chuàng)新與產(chǎn)業(yè)落地。此次合作涵蓋聯(lián)合研發(fā)、產(chǎn)品聯(lián)動、解決方案整合等多個方面,雙方將聚焦多個行業(yè),推動AI技術(shù)的應(yīng)用與發(fā)展,展示了國產(chǎn)大模型在技術(shù)創(chuàng)新和產(chǎn)業(yè)應(yīng)用方面的巨大潛力。
【AiBase提要:】
?? 智譜與生數(shù)科技將聯(lián)合研發(fā)大語言模型和多模態(tài)生成模型,推動技術(shù)創(chuàng)新。
?? 雙方的合作將整合各自的技術(shù)特長,打造更具競爭力的行業(yè)解決方案。
?? 合作將聚焦政企服務(wù)、文化旅游等領(lǐng)域,共同推動AI技術(shù)的規(guī)模化應(yīng)用。
12、寶馬中國宣布新車型接入DeepSeek 含5系、全新X3
寶馬中國在第三季度將推出搭載DeepSeek技術(shù)的新車型,標(biāo)志著其在智能車載系統(tǒng)方面的重要進(jìn)步。此技術(shù)將應(yīng)用于第九代操作系統(tǒng)的多款新車,增強車主與車輛的互動體驗。用戶可通過BMW智能個人助理以自然語言進(jìn)行交流,系統(tǒng)能夠理解并響應(yīng)口語化指令,提供便捷的駕駛體驗。
【AiBase提要:】
?? 寶馬將在第三季度推出搭載DeepSeek技術(shù)的新車型,提升車載智能交互體驗。
??? 用戶可通過BMW智能個人助理以自然語言進(jìn)行交流,系統(tǒng)能理解口語化指令。
?? DeepSeek技術(shù)旨在增強用戶與車輛的互動,提供更便捷的駕駛體驗。
(舉報)