歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。
新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/
1、百度Web端首頁正式上線AI搜入口,全面整合文心大模型能力
百度搜索迎來了重大的更新,推出了AI搜入口,這一功能是在之前AI伙伴的基礎(chǔ)上進(jìn)行全面升級,標(biāo)志著百度在智能搜索領(lǐng)域的又一次突破。AI搜基于文心大模型,深度整合了百度的多個內(nèi)容平臺,提供更可靠的搜索結(jié)果。用戶可以享受多樣化的智能服務(wù)體驗,包括話題探索、問題解決等,同時還集成了文心智能體入口。
【AiBase提要:】
??? AI搜是基于文心大模型的桌面端智能搜索引擎,整合了多個百度內(nèi)容平臺。
?? 用戶可以進(jìn)行話題探索、問題解決、決策輔助等多樣化操作,享受全方位的智能服務(wù)。
?? 集成文心智能體入口,用戶可通過@方式與智能體互動,提升了搜索的個性化和交互性。
2、字節(jié)跳動否認(rèn)開發(fā) AI 手機(jī)傳聞:未有相關(guān)計劃
近日,有關(guān)字節(jié)跳動與努比亞合作開發(fā)AI手機(jī)的消息引發(fā)熱議,但字節(jié)跳動迅速回應(yīng)稱此信息不實,強(qiáng)調(diào)公司并沒有開發(fā)AI手機(jī)的計劃。盡管字節(jié)跳動在人工智能領(lǐng)域的投入持續(xù)增加,然而手機(jī)開發(fā)并不在其未來的發(fā)展戰(zhàn)略中。
【AiBase提要:】
?? 字節(jié)跳動否認(rèn)與努比亞合作開發(fā)AI手機(jī)的傳聞,稱此信息不實。
?? 雙方曾簽署框架協(xié)議,但字節(jié)跳動表示沒有開發(fā)AI手機(jī)的計劃。
?? 字節(jié)跳動將繼續(xù)探索AI技術(shù)在現(xiàn)有產(chǎn)品中的應(yīng)用,以提升市場競爭力。
3、TryOffAnyone:AI試衣反向操作,可提取人物身上穿的衣服
近日,研究者們推出了一項名為“TryOffAnyone”的創(chuàng)新技術(shù),該技術(shù)利用深度學(xué)習(xí)算法從模特身上提取穿著的衣物,并生成多樣化的服裝圖案。用戶只需提供一張圖片的URL,程序便能自動處理并生成相應(yīng)的服裝圖像。
【AiBase提要:】
??? 該技術(shù)可以從人物身上提取出穿著的衣服,并生成多樣化的服裝圖案。
?? 用戶只需提供一張圖片的URL,程序便能自動生成相應(yīng)的服裝圖像,操作簡單方便。
?? 研究團(tuán)隊在VITON-HD數(shù)據(jù)集上進(jìn)行了評估,確保模型的有效性和準(zhǔn)確性。
4、字節(jié)和中國科大出品!VMix:提升擴(kuò)散模型美學(xué)的擴(kuò)展,即插即用
在文本生成圖像的領(lǐng)域,VMix適配器通過創(chuàng)新的條件控制方法顯著提升了擴(kuò)散模型的美學(xué)表現(xiàn)。該技術(shù)利用美學(xué)嵌入將文本提示分解為內(nèi)容和美學(xué)描述,確保生成圖像與文本之間的對齊。實驗結(jié)果表明,VMix在美學(xué)圖像生成方面超越了其他先進(jìn)方法,兼容多種社區(qū)模型,展現(xiàn)出廣泛的應(yīng)用潛力。
【AiBase提要:】
?? VMix適配器通過美學(xué)嵌入將文本提示分解為內(nèi)容和美學(xué)描述,增強(qiáng)圖像生成質(zhì)量。
??? 該適配器兼容多個社區(qū)模型,用戶無需重訓(xùn)練即可提升圖像視覺效果。
? 實驗結(jié)果表明,VMix在美學(xué)生成方面的表現(xiàn)優(yōu)于現(xiàn)有技術(shù),具有廣泛的應(yīng)用潛力。
詳情鏈接:https://vmix-diffusion.github.io/VMix/
5、騰訊AI實驗室與上海交大攜手破解o1模型 “過度思考” 難題
近年來,隨著大語言模型的廣泛應(yīng)用,o1-like模型在推理任務(wù)中展現(xiàn)出過度思考的低效問題。騰訊AI實驗室與上海交通大學(xué)的研究揭示了這一現(xiàn)象,并提出了通過引入效率指標(biāo)來優(yōu)化模型資源利用的新方法。實驗結(jié)果顯示,優(yōu)化策略顯著降低了計算資源的消耗,同時提高了模型在簡單任務(wù)上的準(zhǔn)確性。
【AiBase提要:】
?? 研究揭示o1-like模型在簡單問題上存在“過度思考”現(xiàn)象,導(dǎo)致不必要的計算資源浪費(fèi)。
?? 通過引入結(jié)果效率和過程效率指標(biāo),研究者優(yōu)化模型的計算資源利用,提升推理的有效性。
?? 實驗結(jié)果顯示優(yōu)化策略顯著減少token使用,同時保持或提高模型在簡單任務(wù)上的準(zhǔn)確性。
詳情鏈接:https://arxiv.org/abs/2412.21187
6、超快音效生成模型TangoFlux:僅需3秒鐘就能生成30秒長音頻
TANGOFLUX是一款革命性的文本音頻生成模型,能夠在短短3.7秒內(nèi)生成高達(dá)30秒的高質(zhì)量音頻,展現(xiàn)出卓越的性能和效率。該模型不僅能夠生成各種音效,如鳥鳴和口哨聲,還引入了一種新的優(yōu)化框架CLAP-Ranked Preference Optimization(CRPO),以提升生成音頻的質(zhì)量和對齊性能。
【AiBase提要:】
?? TANGOFLUX是一款高效的文本音頻生成模型,能夠在3.7秒內(nèi)生成30秒的高質(zhì)量音頻。
?? 提出了CLAP-Ranked Preference Optimization(CRPO)框架,以優(yōu)化模型性能和音頻偏好數(shù)據(jù)。
?? 所有代碼和模型已開源,旨在推動文本音頻生成的研究與應(yīng)用。
詳情鏈接:https://tangoflux.github.io/
7、HuggingFace發(fā)布全新開源代碼庫smolagents:支持快速搭建Agent
HuggingFace推出的smolagents是一個全新的開源庫,旨在簡化智能代理的構(gòu)建過程。它允許用戶通過簡化的代碼結(jié)構(gòu)和多種工具支持,輕松創(chuàng)建能夠執(zhí)行各種任務(wù)的智能代理。smolagents不僅支持多種語言模型,還提供了安全的沙盒環(huán)境來執(zhí)行代碼,確保用戶安全。
【AiBase提要:】
?? smolagents是一個新發(fā)布的開源庫,旨在簡化智能代理的構(gòu)建過程。
?? 用戶可以通過定義工具和模型,快速創(chuàng)建智能代理以完成特定任務(wù)。
?? 使用代碼執(zhí)行操作比傳統(tǒng)方法更有效,能夠提升AI代理的性能與靈活性。
詳情鏈接:https://huggingface.co/blog/smolagents
8、上交大揭露AI審稿弊端 一句話就能讓論文評分大幅提高
學(xué)術(shù)同行評審面臨壓力,研究顯示大型語言模型(LLM)在審稿中存在嚴(yán)重風(fēng)險。上海交通大學(xué)的研究揭示,作者可通過操控內(nèi)容影響LLM評分,顯性操控顯著提高評分并降低與人類評審一致性。此外,LLM容易受到隱性操控影響,且存在幻覺問題和偏見。
【AiBase提要:】
?? LLM審稿存在顯性和隱性操控風(fēng)險,可能導(dǎo)致評分失真。
?? LLM在評審中容易受到幻覺問題和論文長度偏見的影響。
?? 研究者建議暫停使用LLM進(jìn)行審稿,直至建立有效的安全措施。
詳情鏈接:https://arxiv.org/pdf/2412.01708
9、151個上榜!工信部公布人工智能賦能新型工業(yè)化典型應(yīng)用案例名單
工信部發(fā)布了151個典型應(yīng)用案例,展示了人工智能在工業(yè)領(lǐng)域的廣泛應(yīng)用。這些案例不僅體現(xiàn)了國家在推動新型工業(yè)化進(jìn)程中的決心,還有效引領(lǐng)了人工智能技術(shù)的深入發(fā)展。通過政策、資金及項目支持,地方政府和企業(yè)可以共同探索和推廣人工智能的應(yīng)用,促進(jìn)整個行業(yè)的技術(shù)升級與創(chuàng)新。
【AiBase提要:】
??151個典型應(yīng)用案例發(fā)布,助力人工智能在工業(yè)領(lǐng)域的應(yīng)用。
?? 工信部呼吁加大支持力度,推動政策與資金落實。
?? 人工智能成為推動新型工業(yè)化的重要動力,促進(jìn)行業(yè)技術(shù)升級。
10、卷瘋了!AI巨頭們紛紛大幅降價以爭奪市場份額
隨著生成式AI市場競爭的加劇,主要科技公司紛紛采取降價策略以爭奪市場份額。阿里云宣布多款A(yù)I產(chǎn)品降價最高達(dá)85%,標(biāo)志著競爭進(jìn)入白熱化階段。OpenAI和谷歌也緊隨其后,推出降價產(chǎn)品以應(yīng)對市場壓力。同時,AI模型的高價維持面臨挑戰(zhàn),尤其是在開源模型和新興企業(yè)的競爭下。
【AiBase提要:】
?? 阿里云宣布對多款 AI 產(chǎn)品降價,最高幅度達(dá)85%。
?? AI 行業(yè)競爭加劇,OpenAI 和谷歌紛紛降價以爭奪市場份額。
?? 未來 OpenAI 可能推出高達(dá)2000美元的高級模型,尋求營收增長。
11、微軟論文再曝OpenAI模型參數(shù)?醫(yī)療AI評測意外暴露4o-mini只有8B
在最新的研究論文中,微軟意外披露了多家頂級AI公司的模型參數(shù),尤其是OpenAI的多個模型。論文中提到,OpenAI的o1-preview模型參數(shù)約為300B,而GPT-4o和GPT-4o-mini的參數(shù)分別為200B和8B。這引發(fā)了業(yè)內(nèi)對模型架構(gòu)和技術(shù)實力的熱議。此外,Claude3.5Sonnet在醫(yī)療文檔錯誤檢測中表現(xiàn)突出,得分領(lǐng)先。此次泄露再次引發(fā)對AI模型參數(shù)透明度的關(guān)注,尤其是在OpenAI逐漸淡化開源承諾的背景下。
【AiBase提要:】
?? 微軟論文揭示OpenAI多個模型參數(shù),o1-preview為300B,GPT-4o為200B,GPT-4o-mini僅8B。
?? 論文的主要目的是介紹MEDEC醫(yī)療基準(zhǔn)測試,Claude3.5Sonnet在錯誤檢測中表現(xiàn)優(yōu)異,得分70.16。
?? 業(yè)內(nèi)對模型參數(shù)的真實性展開討論,特別是未提及谷歌Gemini的參數(shù),可能與其使用TPU有關(guān)。
詳情鏈接:https://arxiv.org/pdf/2412.19260
12、英偉達(dá)2024年斥資10億美元投資AI初創(chuàng)企業(yè)
英偉達(dá)在2024年積極投資人工智能領(lǐng)域,向多家初創(chuàng)公司注入10億美元,鞏固其在技術(shù)革命中的支持者地位。通過與初創(chuàng)企業(yè)的合作,英偉達(dá)不僅推動了自身技術(shù)的進(jìn)步,還助力了醫(yī)療、金融、教育等多個行業(yè)的創(chuàng)新解決方案。
【AiBase提要:】
?? 英偉達(dá)在2024年向人工智能初創(chuàng)企業(yè)投資了10億美元,成為技術(shù)革命的重要支持者。
?? 投資涵蓋醫(yī)療、金融、教育等多個行業(yè),助力初創(chuàng)公司開發(fā)創(chuàng)新解決方案。
?? 英偉達(dá)計劃繼續(xù)關(guān)注新興技術(shù)領(lǐng)域,通過資本與技術(shù)結(jié)合推動更多企業(yè)發(fā)展。
13.百度25周年李彥宏發(fā)全員信:AI應(yīng)用將在2025年井噴
在百度25周年之際,創(chuàng)始人李彥宏發(fā)布全員信,強(qiáng)調(diào)技術(shù)創(chuàng)新是公司核心競爭力,預(yù)計 AI 應(yīng)用將在2025年迅速增長。他回顧了百度的發(fā)展歷程,從最初的網(wǎng)頁搜索到如今的全棧技術(shù),展現(xiàn)了技術(shù)對公司的重要性,并鼓勵員工繼續(xù)努力,迎接未來的挑戰(zhàn)。
【AiBase 提要:】
?? 百度將超過20% 資金投入研發(fā),推動技術(shù)創(chuàng)新。
?? 李彥宏期待2025年 AI 應(yīng)用實現(xiàn)重大突破與市場認(rèn)可。
?? 公司致力于將前沿技術(shù)轉(zhuǎn)化為實際產(chǎn)品,服務(wù)更多人。
(舉報)