歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。
新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/
1、Manus開源平替!Kortix-AI正式發(fā)布開源通用AI智能體平臺Suna
Kortix-AI推出了Suna,一個開源的通用AI智能體平臺,旨在成為Manus的替代品。Suna集成了多種功能,如瀏覽器自動化、文件管理和API集成,能夠通過自然語言對話自動化處理復(fù)雜任務(wù)。該項目已在GitHub上線,迅速吸引了AI開發(fā)者和自動化愛好者的關(guān)注。
【AiBase提要:】
?? Suna集成瀏覽器自動化、文件管理和API集成等多種功能,支持復(fù)雜任務(wù)的自動化處理。
?? 通過模塊化設(shè)計,Suna為用戶提供從數(shù)據(jù)處理到流程自動化的完整解決方案,適用于多種實際場景。
?? Suna的開源特性和靈活部署選項使其成為開發(fā)者和企業(yè)的理想選擇,降低了開發(fā)與部署的門檻。
詳情鏈接:https://github.com/kortix-ai/suna
2、騰訊混元3D生成模型正式發(fā)布2.5版本
騰訊混元3D生成模型的2.5版本正式發(fā)布,標(biāo)志著3D生成技術(shù)進(jìn)入超高清時代。此次升級在建模精細(xì)度和用戶體驗上都有顯著提升,降低了3D內(nèi)容創(chuàng)作的門檻。新版本支持4K高清紋理和細(xì)粒度bump貼圖,極大增強(qiáng)了模型的真實感和質(zhì)感。此外,免費生成額度翻倍,吸引更多創(chuàng)作者使用,推動3D內(nèi)容創(chuàng)作的普及。
【AiBase提要:】
?? 建模精細(xì)度提升,幾何分辨率達(dá)到1024,模型表面更平整、細(xì)節(jié)更豐富。
?? 免費生成額度翻倍,提升至每天20次,吸引更多創(chuàng)作者嘗試使用。
?? 混元3D生成API上線騰訊云,支持企業(yè)級應(yīng)用,推動3D內(nèi)容創(chuàng)作普及。
詳情鏈接:https://3d.hunyuan.tencent.com/
3、海螺推出圖像人物參考功能,允許用戶基于單張圖像生成多角度、動態(tài)姿勢的角色圖像
MiniMax旗下的Hailuo AI推出了Hailuo Image的全新功能——Character Reference,允許用戶基于單張參考圖像生成多角度、動態(tài)姿勢的角色圖像。此功能引入了豐富的表情控制和電影化的光影效果,極大提升了AI圖像生成的創(chuàng)意表達(dá)和角色一致性。
【AiBase提要:】
?? 多角度與動態(tài)姿勢:用戶可基于單張圖像生成角色在不同視角與姿勢的圖像,保持角色特征一致。
?? 豐富表情控制:支持多樣化角色表情生成,確保情感表達(dá)自然生動,適合敘事與品牌內(nèi)容創(chuàng)作。
?? 電影化光影與構(gòu)圖:提供專業(yè)光影效果與優(yōu)化構(gòu)圖,生成結(jié)果媲美電影畫面,增強(qiáng)視覺沖擊力。
詳情鏈接:https://hailuoai.video/create
4、百度上線“心響”App 號稱復(fù)雜任務(wù)全托管超級AI智能體
百度近期推出了心響App,這是一款專為移動端設(shè)計的多智能體協(xié)作應(yīng)用。該應(yīng)用通過智能化手段解決用戶在日常生活中遇到的復(fù)雜需求。心響App整合了地圖類MCP功能,支持行程自動標(biāo)注和出行打車推薦,用戶只需自然語言描述需求,系統(tǒng)便能快速規(guī)劃出行方案。此外,該應(yīng)用在健康和法律領(lǐng)域引入了多智能體協(xié)作機(jī)制,提供更專業(yè)的咨詢服務(wù)。
【AiBase提要:】
??? 心響App整合了地圖類MCP功能,提供行程自動標(biāo)注和出行打車推薦服務(wù)。
?? 在健康領(lǐng)域,系統(tǒng)通過調(diào)度多位“醫(yī)生AI分身”進(jìn)行聯(lián)合會診,提供全面的健康建議。
?? 法律服務(wù)方面,多個律師AI分身組成的“律師智囊團(tuán)”協(xié)同為用戶提供高質(zhì)量的法律咨詢。
5、顛覆性開源 TTS 模型 Dia 發(fā)布:情緒、非語言提示全支持,媲美真人對話
Nari Labs 發(fā)布了其開源文本轉(zhuǎn)語音模型 Dia,具備16億參數(shù),旨在生成自然對話。與 ElevenLabs 和谷歌的產(chǎn)品相比,Dia 的表現(xiàn)更為出色,尤其在情感語調(diào)和非語言提示方面。該模型在零資金情況下開發(fā),已在 Hugging Face 和 GitHub 開源,支持用戶下載和本地部署。
【AiBase提要:】
?? Dia 是一個擁有16億參數(shù)的開源文本轉(zhuǎn)語音模型,旨在生成自然對話。
?? 該模型支持情緒語調(diào)和非語言音頻提示,能夠正確解讀多種文本標(biāo)簽。
?? Dia 的代碼和權(quán)重已在 Hugging Face 和 GitHub 上開源,供用戶下載和體驗。
詳情鏈接:https://github.com/nari-labs/dia
6、Grok大更新!視覺能力、多語言音頻處理與實時搜索功能震撼上線
Grok的最新更新為用戶帶來了顯著的功能提升,特別是在視覺處理、多語言音頻交互和實時搜索方面的突破。這些新功能不僅增強(qiáng)了Grok的智能化水平,還提升了用戶的交互體驗。通過視覺能力,用戶可以上傳圖片進(jìn)行分析,而多語言音頻處理則支持145種語言的實時語音交互,極大地方便了跨語言溝通。
【AiBase提要:】
??? Grok的視覺處理能力現(xiàn)已上線,用戶可通過上傳圖片分析復(fù)雜視覺內(nèi)容,提升應(yīng)用價值。
?? 支持145種語言的多語言音頻處理功能,用戶可以享受流暢的語音交互體驗,適用于多種場景。
?? 新增的實時搜索功能使用戶能夠通過語音指令快速獲取最新信息,提升了信息的時效性與可信度。
7、Genspark AI幻燈片工具發(fā)布,革新專業(yè)演示文稿創(chuàng)作
Genspark推出的AI幻燈片工具通過自動化和智能整合,顯著提升了專業(yè)演示文稿的創(chuàng)作效率。該工具支持多種數(shù)據(jù)格式的處理,能夠快速生成學(xué)術(shù)報告和商業(yè)演示,尤其適合學(xué)術(shù)研究和企業(yè)報告。用戶反饋積極,認(rèn)為其高效性和藝術(shù)風(fēng)格化的功能為演示文稿創(chuàng)作帶來了新的可能性,未來還將不斷優(yōu)化與擴(kuò)展。
【AiBase提要:】
?? 多格式數(shù)據(jù)整合:支持處理多種數(shù)據(jù)格式,自動提取關(guān)鍵信息,減少手動整理時間。
?? 學(xué)術(shù)報告生成:利用自然語言處理快速生成包含引文和可視化圖表的學(xué)術(shù)報告,適合學(xué)術(shù)場景。
?? 藝術(shù)風(fēng)格化支持:提供多種視覺表達(dá)選項,用戶可根據(jù)品牌需求生成個性化演示文稿。
8、Character.AI 推出 AvatarFX 模型:讓靜態(tài)圖片中的人物“開口說話”
Character.AI 最近推出的 AvatarFX 模型是一項革命性的技術(shù),它能夠?qū)㈧o態(tài)圖片轉(zhuǎn)化為生動的可說話視頻角色。通過先進(jìn)的動態(tài)生成技術(shù),AvatarFX 不僅實現(xiàn)了圖像中的人物動態(tài)表情和唇部同步,還提供多樣的音頻選擇,增強(qiáng)了用戶的沉浸感。此外,平臺非常重視用戶的安全體驗,確保創(chuàng)作過程中的內(nèi)容健康。
【AiBase提要:】
?? AvatarFX 利用基于擴(kuò)散模型的動態(tài)生成技術(shù),將靜態(tài)圖片轉(zhuǎn)化為生動的視頻角色,具備真實感的表情和動作。
?? 內(nèi)置多種音頻功能,用戶可自由選擇不同風(fēng)格的聲音,增強(qiáng)故事敘述的生動性和吸引力。
??? 平臺重視用戶安全,提供強(qiáng)大的安全控制措施,確保創(chuàng)作環(huán)境健康,避免不適當(dāng)內(nèi)容風(fēng)險。
詳情鏈接:https://character-ai.github.io/avatar-fx/
9、白板+代碼編輯器組合工具pad.ws:開發(fā)者可在同一界面畫圖編程,實現(xiàn)邊畫邊寫代碼
pad.ws是一款創(chuàng)新的在線工具,將白板與代碼編輯器完美結(jié)合,為開發(fā)者和設(shè)計師提供了全新的協(xié)作體驗。它支持多種編程語言,并具備實時協(xié)作、無限畫布等功能,滿足了遠(yuǎn)程團(tuán)隊和教育場景的多樣化需求。用戶反饋顯示,pad.ws以其流暢的用戶體驗和開源特性受到廣泛歡迎,未來有望推出更多創(chuàng)新功能。
【AiBase提要:】
??? 無限畫布與協(xié)作白板:用戶可以在無限畫布上繪制流程圖和草圖,支持多人實時協(xié)作,提升團(tuán)隊效率。
?? 實時代碼編輯:內(nèi)置支持多種編程語言的代碼編輯器,提供語法高亮和錯誤提示,實現(xiàn)邊畫邊碼的流暢體驗。
?? 開源與隱私保護(hù):作為開源工具,用戶可定制功能,支持本地部署和端到端加密,確保數(shù)據(jù)安全。
詳情鏈接:https://github.com/pad-ws/pad.ws
10、OpenBMB “卷姬” 入職!革新長文本生成,挑戰(zhàn)傳統(tǒng)綜述模式
OpenBMB開源社區(qū)新成員“卷姬”在長文本生成領(lǐng)域引起了廣泛關(guān)注。通過信息熵和卷積算法,“卷姬”能夠高效整合大量文獻(xiàn),生成高質(zhì)量的綜述報告。用戶只需提供關(guān)鍵詞,便可獲得邏輯嚴(yán)謹(jǐn)、見解獨到的內(nèi)容。與其他模型的橫向評測顯示,“卷姬”在結(jié)構(gòu)、內(nèi)容及引用方面表現(xiàn)優(yōu)異,展現(xiàn)出強(qiáng)大的技術(shù)實力。
【AiBase提要:】
?? “卷姬”利用信息熵和卷積算法,快速整合海量文獻(xiàn)生成高質(zhì)量綜述。
?? 用戶可通過簡單操作獲取綜述報告,支持普通和專業(yè)模式。
?? LLMxMapReduce-V2技術(shù)賦能“卷姬”,在長文本生成領(lǐng)域展現(xiàn)強(qiáng)勁實力。
詳情鏈接:https://surveygo.thunlp.org/
11、騰訊混元大模型AI閱讀助手——企鵝讀伴正式上線
騰訊在世界讀書日推出的“企鵝讀伴”是一款創(chuàng)新的AI閱讀助手,旨在為中小學(xué)生提供豐富的閱讀體驗。該產(chǎn)品結(jié)合了AI技術(shù)與教育理念,能夠根據(jù)學(xué)生的年級和興趣進(jìn)行個性化書籍推薦。通過角色扮演、情景生成等互動方式,學(xué)生不僅能深入理解經(jīng)典作品,還能在游戲化的環(huán)境中提升閱讀興趣,最終實現(xiàn)閱讀成果的量化和可追蹤。
【AiBase提要:】
?? AI技術(shù)支持個性化推薦,提升學(xué)生閱讀體驗。
?? 通過角色扮演和情景生成,增強(qiáng)學(xué)生對經(jīng)典作品的理解。
?? 游戲化設(shè)計激發(fā)閱讀興趣,促進(jìn)主動探索。
12、司法部或迫使谷歌出售 Chrome,OpenAI 表明收購意愿
在谷歌壟斷案的救濟(jì)措施審理階段,OpenAI 表示有意收購 Chrome 瀏覽器。美國司法部要求谷歌剝離該產(chǎn)品,法官已裁定谷歌在搜索領(lǐng)域壟斷。OpenAI 曾與谷歌洽談合作,希望 ChatGPT 使用其搜索技術(shù),但目前依賴必應(yīng)。此舉可能影響谷歌的市場地位,同時也反映了科技巨頭之間的競爭加劇。
【AiBase提要:】
?? OpenAI 表示有意收購谷歌的 Chrome 瀏覽器,若其被迫出售。
?? 美國司法部在“美國訴谷歌”案中提出強(qiáng)制剝離 Chrome 的救濟(jì)措施。
?? OpenAI 高管透露曾與谷歌洽談合作,希望 ChatGPT 使用谷歌搜索技術(shù)。
13、字節(jié)跳動調(diào)整 AI 產(chǎn)品線:貓箱換帥,星繪并入豆包,All in 增長
字節(jié)跳動近期對AI產(chǎn)品部門Flow進(jìn)行了重要調(diào)整,旨在應(yīng)對增長壓力。貓箱更換負(fù)責(zé)人,星繪團(tuán)隊并入豆包App,資源集中于核心產(chǎn)品豆包,以期實現(xiàn)更快增長。字節(jié)在AI領(lǐng)域的策略更側(cè)重于用戶規(guī)模擴(kuò)張,盡管面臨激烈市場競爭,這一調(diào)整能否帶來新的增長值得關(guān)注。
【AiBase提要:】
?? 貓箱更換負(fù)責(zé)人,原負(fù)責(zé)人離職,新負(fù)責(zé)人為西原,旨在提升產(chǎn)品表現(xiàn)。
?? 星繪團(tuán)隊計劃并入豆包App,由陸游統(tǒng)一管理,資源整合以聚焦核心產(chǎn)品。
?? 字節(jié)跳動在AI領(lǐng)域面臨增長壓力,調(diào)整策略以期在競爭中尋求突破。
(舉報)