歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開(kāi)發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。
新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/
1、阿里發(fā)布 FLUX.1-Turbo-Alpha:基于FLUX.1-dev、8步提煉Lora
阿里媽媽創(chuàng)意團(tuán)隊(duì)發(fā)布了基于FLUX.1-dev模型訓(xùn)練的FLUX.1-Turbo-Alpha,采用8步蒸餾Lora模型,多頭判別器顯著提高蒸餾質(zhì)量,支持多種FLUX相關(guān)應(yīng)用。推薦引導(dǎo)尺度設(shè)置為3.5,Lora尺度為1,未來(lái)將推出更低步數(shù)版本。模型可與Diffusers框架結(jié)合使用,通過(guò)幾行代碼加載模型生成高質(zhì)量圖像。訓(xùn)練過(guò)程在超過(guò)100萬(wàn)幅圖像上進(jìn)行,采用對(duì)抗訓(xùn)練方法,具備6.3以上美學(xué)評(píng)分,分辨率高于800。FLUX.1-Turbo-Alpha的推出推動(dòng)了人工智能技術(shù)的普及與應(yīng)用。
【AiBase提要:】
?? 基于FLUX.1-dev,采用8步蒸餾和多頭判別器,提升圖像生成質(zhì)量。
??? 支持文本到圖像生成及修復(fù)控制網(wǎng),用戶可輕松創(chuàng)建多種有趣場(chǎng)景。
?? 訓(xùn)練過(guò)程采用對(duì)抗訓(xùn)練,訓(xùn)練數(shù)據(jù)超過(guò)100萬(wàn)張圖像,確保模型高質(zhì)量輸出。
詳情鏈接:https://huggingface.co/alimama-creative/FLUX.1-Turbo-Alpha
2、告別繁瑣對(duì)齊!F5-TTS 讓文本轉(zhuǎn)語(yǔ)音變得輕松自如!
最近,來(lái)自上海交通大學(xué)、劍橋大學(xué)和吉利汽車研究院的研究團(tuán)隊(duì)推出了一種全新的文本到語(yǔ)音(TTS)系統(tǒng),名為 F5-TTS。這種系統(tǒng)的特別之處在于,它采用了一種無(wú)自回歸的方法,結(jié)合了流匹配與擴(kuò)散變換器(DiT),成功簡(jiǎn)化了傳統(tǒng) TTS 模型中的復(fù)雜步驟。
【AiBase 提要:】
?? F5-TTS 是一種新型無(wú)自回歸文本到語(yǔ)音系統(tǒng),簡(jiǎn)化了傳統(tǒng) TTS 模型的復(fù)雜性。
? 該系統(tǒng)結(jié)合 ConvNeXt 和 DiT,提高文本與語(yǔ)音的對(duì)齊效果,提升合成質(zhì)量。
?? 研究團(tuán)隊(duì)關(guān)注倫理問(wèn)題,建議引入水印和檢測(cè)機(jī)制以防濫用。
項(xiàng)目入口:https://github.com/SWivid/F5-TTS
體驗(yàn)地址:https://huggingface.co/spaces/mrfakename/E2-F5-TTS
3、OPPO 文檔 AI新功能曝光!支持蘋果 iWork 格式轉(zhuǎn)換、文檔翻譯、掃描文檔等!
OPPO 官方今日發(fā)布了一條預(yù)熱消息,宣布即將推出全新的文檔應(yīng)用。根據(jù)預(yù)熱消息,這款應(yīng)用將支持多項(xiàng)功能,包括“文件隨心開(kāi)”、“AI 隨心幫寫”、“格式隨心轉(zhuǎn)換”和“文檔隨心搜索”。
【AiBase 提要:】
?? OPPO 即將推出全新文檔應(yīng)用,支持多項(xiàng) AI 功能。
?? 應(yīng)用可進(jìn)行蘋果 iWork 格式轉(zhuǎn)換,提升兼容性。
?? 提供文檔掃描和翻譯功能,優(yōu)化文檔處理體驗(yàn)。
4、螞蟻CodeFuse IDE0.6版發(fā)布 支持編輯器診斷問(wèn)題 AI 修復(fù)
螞蟻CodeFuse IDE0.6版本發(fā)布,新增編輯器診斷問(wèn)題AI修復(fù)功能和內(nèi)斂補(bǔ)全特性,提升代碼編寫便捷性和效率。IDE支持主流編程語(yǔ)言,提供代碼編寫建議、問(wèn)題修復(fù)等功能。
【AiBase提要:】
?? IDE新增編輯器診斷問(wèn)題AI修復(fù)功能,開(kāi)發(fā)者可通過(guò)懸停觸發(fā)智能修復(fù)按鈕解決錯(cuò)誤信息。
?? 優(yōu)化代碼智能補(bǔ)全體驗(yàn),支持下拉補(bǔ)全和內(nèi)斂補(bǔ)全同時(shí)出現(xiàn),用戶可通過(guò)Tab鍵快速采納內(nèi)斂補(bǔ)全。
?? CodeFuse IDE基于螞蟻?zhàn)匝写竽P秃蚈penSumi框架開(kāi)發(fā),提供智能終端、單元測(cè)試生成等功能。
詳情鏈接:https://github.com/codefuse-ai/codefuse-ide
5、蘋果的 “多模態(tài)煉丹爐” 又升級(jí)!MM1.5增強(qiáng)文本密集、多圖理解
蘋果公司最近為其多模態(tài)人工智能模型MM1推出了重大更新,將其升級(jí)為MM1.5版本。這次升級(jí)不僅僅是簡(jiǎn)單的版本號(hào)變更,而是全方位的能力提升,使得模型在各個(gè)領(lǐng)域都展現(xiàn)出了更強(qiáng)大的性能。MM1.5的核心升級(jí)在于其創(chuàng)新的數(shù)據(jù)處理方法,包括高清晰度的OCR數(shù)據(jù)和合成圖像描述的使用,以及優(yōu)化的視覺(jué)指令微調(diào)數(shù)據(jù)混合。
【AiBase提要:】
?? MM1.5采用以數(shù)據(jù)為中心的訓(xùn)練方法,優(yōu)化了訓(xùn)練數(shù)據(jù)集,在文字識(shí)別、圖像理解和執(zhí)行視覺(jué)指令等方面表現(xiàn)顯著提升。
?? MM1.5涵蓋了從10億到300億參數(shù)的多個(gè)版本,包括密集型和專家混合(MoE)變體,即使是較小規(guī)模的模型也能達(dá)到令人印象深刻的性能水平。
?? MM1.5的能力提升主要體現(xiàn)在文本密集型圖像理解、視覺(jué)指代和定位、多圖像推理、視頻理解以及移動(dòng)UI理解等方面,拓展了應(yīng)用場(chǎng)景。
詳情鏈接:https://arxiv.org/pdf/2409.20566
6、合成數(shù)據(jù)有毒!Meta團(tuán)隊(duì)證實(shí):1%數(shù)據(jù)就能讓大模型完全崩潰
最近AI圈子發(fā)生了一件怪事,就像一個(gè)吃播博主突然開(kāi)始吃自己做的菜,越吃越上癮,菜也越來(lái)越難吃。這事兒說(shuō)起來(lái)還挺嚇人,專業(yè)的術(shù)語(yǔ)叫模型崩潰(model collapse)。模型崩潰是AI模型在訓(xùn)練過(guò)程中,如果大量使用自己生成的數(shù)據(jù),就會(huì)陷入惡性循環(huán),導(dǎo)致模型生成的質(zhì)量越來(lái)越差,最終完?duì)僮印?/p>
【AiBase提要:】
?? 模型崩潰現(xiàn)象:AI模型在訓(xùn)練中過(guò)度依賴合成數(shù)據(jù)導(dǎo)致生成質(zhì)量下降,最終崩潰。
?? 解決方案:優(yōu)先使用真實(shí)數(shù)據(jù),謹(jǐn)慎使用合成數(shù)據(jù),控制模型規(guī)模,避免模型崩潰。
?? 實(shí)驗(yàn)發(fā)現(xiàn):即使使用1%的合成數(shù)據(jù)也可能導(dǎo)致模型崩潰,模型規(guī)模越大,崩潰現(xiàn)象更嚴(yán)重。
詳情鏈接:https://arxiv.org/pdf/2410.04840
7、獲獎(jiǎng)AI畫作《太空歌劇院》版權(quán)申請(qǐng)?jiān)饩?/strong>
最近,合成媒體藝術(shù)家Jason Allen因創(chuàng)作的作品《太空歌劇院》遭到版權(quán)辦公室拒絕注冊(cè)引發(fā)爭(zhēng)議。Allen不滿決定上訴,認(rèn)為作品中有大量人類創(chuàng)作成分,應(yīng)獲版權(quán)保護(hù)。AI生成的作品是否應(yīng)獲得版權(quán)保護(hù)成為焦點(diǎn),引發(fā)關(guān)于AI藝術(shù)創(chuàng)作版權(quán)法律的討論。
【AiBase提要:】
?? Allen認(rèn)為作品中有大量人類創(chuàng)作成分,應(yīng)獲得版權(quán)保護(hù)。
?? 版權(quán)辦公室認(rèn)為AI生成作品缺乏足夠人類創(chuàng)作,拒絕注冊(cè)。
?? Allen的上訴可能推動(dòng)AI藝術(shù)創(chuàng)作版權(quán)法律的進(jìn)一步討論。
8、臺(tái)積電第三季度利潤(rùn)增長(zhǎng)40%,AI 熱潮助推需求激增
最近,臺(tái)積電宣布預(yù)計(jì)第三季度凈利潤(rùn)將大幅增長(zhǎng)40%,受益于AI芯片需求激增。公司客戶包括蘋果、英偉達(dá)等知名企業(yè),推動(dòng)AI技術(shù)發(fā)展。市場(chǎng)對(duì)臺(tái)積電未來(lái)表現(xiàn)樂(lè)觀,營(yíng)收和資本支出計(jì)劃均有提升。
【AiBase提要:】
?? 臺(tái)積電第三季度凈利潤(rùn)預(yù)計(jì)將達(dá)到2982億新臺(tái)幣,較去年同期增長(zhǎng)40%。
?? 臺(tái)積電的客戶正在推出新產(chǎn)品,推動(dòng)其業(yè)績(jī)超預(yù)期增長(zhǎng)。
?? 臺(tái)積電加大投資建設(shè)新工廠,未來(lái)資本支出預(yù)計(jì)在300億至320億美元之間。
9、Anthropic CEO:AI將助力人類抗擊疾病5-10年內(nèi)人類壽命可延長(zhǎng)至150歲
在Anthropic的CEO達(dá)里奧·阿莫代伊的文章中,他大膽預(yù)測(cè)了人工智能(AI)在未來(lái)的發(fā)展。盡管公眾對(duì)AI的風(fēng)險(xiǎn)有所擔(dān)憂,但他認(rèn)為AI的積極潛力巨大,可以為人類社會(huì)帶來(lái)前所未有的進(jìn)步。阿莫代伊強(qiáng)調(diào)了處理AI風(fēng)險(xiǎn)的緊迫性,并警告過(guò)度夸大技術(shù)可能帶來(lái)的誤導(dǎo)。他展望了AI在生物學(xué)、健康、神經(jīng)科學(xué)、心理健康、經(jīng)濟(jì)、貧困和智者國(guó)度等領(lǐng)域的變革。
【AiBase提要:】
?? 生物學(xué)和健康: AI能加速醫(yī)學(xué)進(jìn)步,控制傳染病、降低癌癥死亡率、治療遺傳病,預(yù)計(jì)人類壽命可翻倍至150歲。
?? 生物自由: AI賦予人類更多生物學(xué)特征控制權(quán),包括生育和外貌選擇。
?? 神經(jīng)科學(xué)和心理健康: AI應(yīng)用改善精神疾病理解和治療,提升心理健康。
10、蘋果可能會(huì)在明年推出售價(jià)2000美元的 Vision 頭顯
蘋果公司計(jì)劃推出新型 Vision 頭顯,價(jià)格約為2,000美元,采用更便宜的材料和性能更低的處理器。該設(shè)備不包含 EyeSight 功能,是蘋果混合現(xiàn)實(shí)計(jì)劃的一部分。蘋果還將推出第二代 Vision Pro、智能眼鏡和帶攝像頭的 AirPods,以及價(jià)格實(shí)惠的類似 iPad 的屏幕和帶機(jī)械臂的桌面設(shè)備。盡管混合現(xiàn)實(shí)計(jì)劃并未取得巨大成功,蘋果仍堅(jiān)持推進(jìn)相關(guān)產(chǎn)品的開(kāi)發(fā)。
【AiBase提要:】
?? 蘋果計(jì)劃推出價(jià)格約為2,000美元的新型 Vision 頭顯,采用更便宜的材料和性能更低的處理器。
?? 蘋果將在未來(lái)推出第二代 Vision Pro、智能眼鏡和帶攝像頭的 AirPods,推動(dòng)混合現(xiàn)實(shí)領(lǐng)域的發(fā)展。
?? 蘋果還計(jì)劃推出價(jià)格實(shí)惠的類似 iPad 的屏幕和帶機(jī)械臂的桌面設(shè)備,作為智能家居戰(zhàn)略的一部分。
11、谷歌在美國(guó)搜索廣告市場(chǎng)份額或?qū)⒌?0%
谷歌在美國(guó)搜索廣告市場(chǎng)份額可能在2025年跌破50%,面臨新競(jìng)爭(zhēng)者挑戰(zhàn)。新興競(jìng)爭(zhēng)者如TikTok、亞馬遜和人工智能初創(chuàng)公司Perplexity正搶占市場(chǎng)份額。亞馬遜在搜索廣告開(kāi)支中增長(zhǎng)迅速,對(duì)谷歌構(gòu)成壓力。人工智能的發(fā)展改變搜索廣告格局,谷歌計(jì)劃在AI搜索摘要中插入廣告。搜索廣告市場(chǎng)正經(jīng)歷深刻變革。
【AiBase提要:】
?? 谷歌搜索廣告市場(chǎng)份額預(yù)計(jì)將在2025年跌破50%,面臨新競(jìng)爭(zhēng)者的挑戰(zhàn)。
?? TikTok和亞馬遜正迅速崛起,搶占谷歌的市場(chǎng)份額。
?? 谷歌計(jì)劃在AI搜索摘要中加入廣告,為品牌提供新的投放渠道。
12、聯(lián)想發(fā)布ThinkSmart Core Gen2專為視頻會(huì)議打造 AI助力高效協(xié)作!
聯(lián)想推出的ThinkSmart Core Gen2為智能協(xié)作領(lǐng)域帶來(lái)突破,搭載英特爾Core Ultra處理器,強(qiáng)大的AI處理能力提升會(huì)議效率,重新定義會(huì)議空間和工作方式,實(shí)現(xiàn)智能協(xié)作體驗(yàn)。
【AiBase提要:】
?? ThinkSmart Core Gen2搭載英特爾Core Ultra處理器,集成神經(jīng)處理單元,AI處理能力強(qiáng)大,能耗降低40%。
?? 支持Microsoft Teams Rooms和Zoom Rooms,提供AI增強(qiáng)功能,包括智能框選、自動(dòng)語(yǔ)音識(shí)別、智能姿態(tài)標(biāo)簽等。
?? 提供高度自動(dòng)化和前瞻性管理,預(yù)裝ThinkSmart Manager軟件和ThinkShield解決方案確保全方位安全保護(hù)。
(舉報(bào))