歡迎來到【AI日報(bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。
新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/
1、OpenAI宣布ChatGPT搜索升級 支持地圖、高級語音等功能
OpenAI在最新的直播中宣布了ChatGPT平臺的重大技術(shù)更新,推出了實(shí)時搜索和高級語音交互模式,極大提升了用戶體驗(yàn)。通過優(yōu)化搜索算法,用戶能夠快速獲取實(shí)時信息,并直接查看源鏈接,增強(qiáng)了信息的便捷性。此外,新增的視頻播放和地圖集成功能,為用戶提供了更直觀的搜索體驗(yàn),提升了移動端的搜索效率。
【AiBase提要:】
?? 更新后的ChatGPT引入了實(shí)時搜索功能,優(yōu)化了搜索算法,使用戶能夠快速獲取股票和新聞等實(shí)時信息。
??? 新增的高級語音交互模式允許用戶通過語音進(jìn)行多輪搜索,提供個性化的語音助手體驗(yàn)。
??? ChatGPT現(xiàn)在支持地圖集成功能,用戶可以直接查看地理位置信息,進(jìn)行路線規(guī)劃和地點(diǎn)探索。
2、谷歌升級AI視頻生成模型 Veo2,4K分辨率、人類偏好評分優(yōu)于Sora
谷歌最近發(fā)布了其新一代視頻生成模型Veo2,旨在與OpenAI的Sora競爭。Veo2在視頻生成方面展現(xiàn)了更高的真實(shí)感和細(xì)膩度,用戶可以通過Google Labs的VideoFX平臺申請使用。此外,谷歌還更新了圖像生成模型Imagen3,進(jìn)一步提升了生成圖像的真實(shí)感和色彩表現(xiàn)。
【AiBase提要:】
?? Veo2視頻生成模型質(zhì)量優(yōu)于OpenAI的Sora,用戶可申請使用。
?? 用戶可以選擇視頻風(fēng)格和效果,生成最高可達(dá)4K分辨率的視頻。
?? 更新的Imagen3圖像生成模型表現(xiàn)出更好的藝術(shù)風(fēng)格和用戶體驗(yàn)。
詳情鏈接:https://labs.google/fx/tools/video-fx
3、Midjourney推出個性化模型與情緒板,可上傳圖像訓(xùn)練模型了
2024年12月16日,Midjourney公司推出了備受期待的“情緒版板”功能,允許用戶上傳靈感圖像集以生成新藝術(shù)作品。配合最新的AI模型,用戶可以更輕松地創(chuàng)建個性化資料,簡化了模型建立過程,降低了新用戶的入門門檻。此外,增強(qiáng)的組織功能使得用戶能夠更好地管理多個項(xiàng)目。
【AiBase提要:】
?? Midjourney推出心情板功能,用戶可上傳靈感圖像集。
?? 個性化資料的創(chuàng)建變得更簡單,用戶只需40個評分即可開始。
??? 組織功能增強(qiáng),用戶可命名資料并追蹤相關(guān)圖像。
詳情鏈接:https://www.midjourney.com/personalize
4、谷歌推出全新AI工具Whisk無需提示詞,可多張圖片混合生成新風(fēng)格圖像
谷歌最新推出的AI工具Whisk,顯著改變了傳統(tǒng)的圖像生成方式,允許用戶通過上傳多張圖片來生成新圖像,而不再依賴于冗長的文字描述。Whisk的設(shè)計(jì)旨在快速進(jìn)行視覺探索,用戶可以輕松地將不同風(fēng)格和主題的圖像融合,創(chuàng)造出獨(dú)特的視覺作品。盡管生成圖像的過程可能需要幾秒鐘,并且有時結(jié)果會略顯奇怪,但整體體驗(yàn)非常有趣。
【AiBase提要:】
?? Whisk允許用戶通過多張圖片生成新風(fēng)格圖像,顛覆了傳統(tǒng)的文字提示方式。
? 用戶可以上傳不同主題的圖片,自動融合生成有趣的視覺效果。
?? 谷歌還發(fā)布了Imagen3和Veo2模型,進(jìn)一步提升了圖像和視頻生成的能力。
詳情鏈接:https://top.aibase.com/tool/whisk
5、YouTube新功能上線:允許創(chuàng)作者授權(quán)第三方使用視頻訓(xùn)練AI
YouTube最近推出了一項(xiàng)新功能,允許創(chuàng)作者選擇是否授權(quán)第三方公司使用他們的視頻進(jìn)行人工智能模型的訓(xùn)練。這一功能的默認(rèn)設(shè)置為關(guān)閉,創(chuàng)作者如果不希望第三方使用他們的視頻,無需采取任何行動。
【AiBase提要:】
?? 默認(rèn)設(shè)置為關(guān)閉,創(chuàng)作者需主動選擇允許第三方使用其視頻進(jìn)行AI訓(xùn)練。
?? 允許的第三方公司包括知名AI企業(yè),如OpenAI、蘋果和微軟等。
?? 此功能旨在幫助創(chuàng)作者在AI時代實(shí)現(xiàn)內(nèi)容的新價值。
6、圖森未來發(fā)布圖生視頻模型“Ruyi” 并開源Ruyi-Mini-7B
北京圖森未來科技有限公司于2024年12月17日發(fā)布了其首款“圖生視頻”大模型“Ruyi”,并開源了Ruyi-Mini-7B版本,供用戶在huggingface平臺下載使用。該模型專為消費(fèi)級顯卡設(shè)計(jì),具備多種生成能力,尤其在動漫和游戲領(lǐng)域展現(xiàn)出色的視覺敘事潛力。盡管技術(shù)上取得進(jìn)展,但仍需解決一些缺陷。
【AiBase提要:】
?? Ruyi大模型專為消費(fèi)級顯卡設(shè)計(jì),支持多分辨率和多時長的視頻生成,能夠處理384×384到1024×1024的分辨率。
?? 模型在幀間一致性、動作流暢性和色彩呈現(xiàn)方面表現(xiàn)卓越,成為ACG愛好者的理想創(chuàng)意伙伴。
?? 盡管技術(shù)上取得進(jìn)展,Ruyi仍存在一些缺陷,如手部畸形和面部細(xì)節(jié)崩壞,圖森未來正在努力改進(jìn)。
詳情鏈接:https://huggingface.co/IamCreateAI/Ruyi-Mini-7B
7、智譜AI完成30億元融資 推動大模型技術(shù)研發(fā)與商業(yè)化
智譜公司近期成功完成30億元人民幣的新一輪融資,吸引了眾多戰(zhàn)略投資者和國資機(jī)構(gòu)的參與。這筆資金將用于智譜基座大模型的研發(fā)升級,進(jìn)一步提升其在復(fù)雜推理和多模態(tài)任務(wù)解決方面的能力。盡管面臨市場競爭和技術(shù)進(jìn)展放緩的挑戰(zhàn),智譜依然在AI行業(yè)中保持領(lǐng)先地位,并在全球范圍內(nèi)產(chǎn)生顯著影響。【AiBase提要:】
?? 智譜公司完成30億元融資,資金將用于基座大模型的研發(fā)和升級,推動行業(yè)創(chuàng)新。
?? 今年智譜在B端市場實(shí)現(xiàn)逆勢增長,API收入同比增長超過30倍,付費(fèi)客戶數(shù)增長20倍。
?? 智譜的C端產(chǎn)品“智譜清言”吸引超過2500萬用戶,預(yù)計(jì)付費(fèi)功能將帶來千萬級收入。
8、Meta 推出開源AI試衣模型 Leffa:保留更多細(xì)節(jié)
Meta最近推出了Leffa,一個開源的AI虛擬試穿框架,旨在通過生成新圖像提升用戶的穿衣體驗(yàn)。用戶只需上傳一張參考圖片,系統(tǒng)便能生成新的穿搭效果,減少了因不合適而退換貨的麻煩。Leffa在保留細(xì)節(jié)和減少圖像失真方面表現(xiàn)出色,提供了更自然的試穿效果。
【AiBase提要:】
?? Leffa 是 Meta 推出的開源虛擬試穿框架,可以根據(jù)參考圖像生成新圖像。
?? 該框架能有效減少圖像失真,保留更多細(xì)節(jié),提高虛擬試穿體驗(yàn)。
?? 用戶可在 Hugging Face 平臺上試用 Leffa,同時 Meta 提供了完整的項(xiàng)目代碼。
詳情鏈接:https://github.com/franciszzj/Leffa
9、Diffusion-Vas:追蹤視頻目標(biāo),可補(bǔ)全遮擋部分
在視頻分析領(lǐng)域,物體的持久性是理解物體存在的重要線索。研究者提出的Diffusion-Vas方法,基于擴(kuò)散先驗(yàn),旨在提升視頻無模態(tài)分割和內(nèi)容補(bǔ)全的效果。該方法分為兩個階段,首先生成無模態(tài)掩碼,然后利用條件生成模型對遮擋區(qū)域進(jìn)行內(nèi)容補(bǔ)全。經(jīng)過多項(xiàng)基準(zhǔn)測試,該方法在復(fù)雜場景下表現(xiàn)優(yōu)異,準(zhǔn)確率提高了13%。
【AiBase提要:】
?? 研究提出了一種新方法,通過擴(kuò)散先驗(yàn)實(shí)現(xiàn)視頻中的無模態(tài)分割和內(nèi)容補(bǔ)全。
??? 方法分為兩階段,首先生成無模態(tài)掩碼,然后進(jìn)行遮擋區(qū)域的內(nèi)容補(bǔ)全。
?? 在多項(xiàng)基準(zhǔn)測試中,該方法顯著提高了無模態(tài)分割的準(zhǔn)確性,尤其在復(fù)雜場景下表現(xiàn)優(yōu)異。
詳情鏈接:https://diffusion-vas.github.io/
10、Meta智能眼鏡Ray-Ban Meta升級:實(shí)時AI視頻與翻譯功能
Meta公司對Ray-Ban Meta智能眼鏡進(jìn)行了重要更新,推出了多項(xiàng)基于人工智能的新功能,包括實(shí)時對話和語言翻譯。這些功能使用戶能夠與AI助手進(jìn)行更自然的交流,無需頻繁喚醒助手,同時也支持多語言即時翻譯,極大提升了用戶的溝通便利性。此外,眼鏡還新增了Shazam功能,用戶可以通過語音識別音樂。
【AiBase提要:】
?? Ray-Ban Meta智能眼鏡推出實(shí)時AI視頻和翻譯功能,用戶可隨時與AI助手對話。
?? 新增的實(shí)時翻譯功能支持多種語言之間的即時翻譯,提升了用戶交流的便利性。
?? 眼鏡還支持Shazam功能,用戶可通過語音識別當(dāng)前播放的音樂。
11、博通CEO預(yù)測AI市場大爆發(fā) 公司市值突破1萬億美元
博通公司首席執(zhí)行官Hock Tan在最近的財(cái)報(bào)電話會議上對AI芯片市場表達(dá)了樂觀的展望,預(yù)計(jì)到2027年,博通在這一領(lǐng)域的收入將顯著增長,服務(wù)可尋址市場預(yù)計(jì)在600億至900億美元之間。公司市值因AI芯片需求激增首次突破1萬億美元。
【AiBase提要:】
?? 博通預(yù)計(jì)到2027年AI市場服務(wù)可尋址市場將達(dá)到600億至900億美元。
?? 博通市值因AI芯片需求激增首次突破1萬億美元。
?? 通過收購VMware,博通整體收入增長達(dá)51%,且運(yùn)營成本大幅降低。
12、金山辦公:WPS AI將免費(fèi)解鎖AI生成PPT等四大功能
金山辦公宣布WPS AI將在年終期間為用戶提供四項(xiàng)免費(fèi)功能,旨在提升工作效率和創(chuàng)意。用戶可以使用AI生成PPT、風(fēng)格克隆、濾鏡等功能,快速制作專業(yè)的年終總結(jié)PPT。此外,WPS還提供多樣化的PPT模板,滿足不同用戶需求。
【AiBase提要:】
?? WPS AI將免費(fèi)解鎖AI生成PPT、風(fēng)格克隆、濾鏡和模板功能,提升用戶工作效率。
??? AI生成PPT功能可快速生成專業(yè)PPT,智能潤色內(nèi)容,保持邏輯和設(shè)計(jì)美感。
?? 用戶可通過“AI總結(jié)季”參與活動,獲取豐富的年終總結(jié)PPT模板,滿足不同行業(yè)需求。
(舉報(bào))