中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

    <td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>
    <rp id="h1kkc"></rp>
    首頁 > AI頭條  > 正文

    字節(jié)Seed 團隊推出 PHD-Transformer,成功擴展預(yù)訓(xùn)練長度,解決 KV 緩存問題!

    2025-04-28 16:20 · 來源: AIbase基地

    近日,字節(jié)跳動的 Seed 團隊在人工智能領(lǐng)域再傳佳音,推出了一種新型的 PHD-Transformer(Parallel Hidden Decoding Transformer),這項創(chuàng)新突破了預(yù)訓(xùn)練長度的限制,有效解決了推理過程中的 KV 緩存膨脹問題。隨著大型推理模型的迅速發(fā)展,研究人員在后訓(xùn)練階段嘗試通過強化學(xué)習(xí)方法來生成更長的推理鏈,并在復(fù)雜的推理任務(wù)上取得了顯著成果。受到啟發(fā),字節(jié) Seed 團隊決定探索在預(yù)訓(xùn)練階段進行長度擴展的可能性。

    傳統(tǒng)的長度擴展方法常常涉及在序列中插入文本或潛在向量,這些方式往往導(dǎo)致 KV 緩存占用過多內(nèi)存,推理速度慢。而 PHD-Transformer 則采用了一種更為簡便的策略 —— 直接重復(fù)輸入的 tokens。盡管這種方法在訓(xùn)練損失和模型性能上有明顯的提升,卻也帶來了 KV 緩存線性增長、內(nèi)存壓力加大和解碼延遲等新問題。

    image.png

    為了解決這些挑戰(zhàn),PHD-Transformer 通過創(chuàng)新的 KV 緩存管理策略,保留了與原始 Transformer 相同的緩存大小。在推理時,PHD-Transformer 只保留由原始 tokens 生成的 KV 緩存,而對重復(fù)的 tokens 則在預(yù)測后立即丟棄,顯著加快了推理速度。此外,研究團隊還引入了滑動窗口注意力機制,稱之為 PHD-SWA,以保持局部滑動窗口緩存的性能優(yōu)勢。為進一步優(yōu)化預(yù)填充時間,研究者提出了逐塊滑動窗口注意力機制 PHD-CSWA,限制了每個塊內(nèi)的順序依賴,從而大幅縮短了預(yù)填充時間。

    在一系列實驗中,PHD-CSWA 表現(xiàn)出色,在多個公開基準測試集上均實現(xiàn)了準確率的提升。研究團隊表示,PHD-CSWA 在保持原有效率的同時,為模型帶來了更大的性能提升,標志著在大規(guī)模推理任務(wù)中,預(yù)訓(xùn)練長度擴展取得了實質(zhì)性進展。

    • 相關(guān)推薦
    • AI日報:國內(nèi)首個多模態(tài)AI程序員上崗;字節(jié)啟動Top Seed計劃招募AI人才;DeepSeek R1T Chimera上線OpenRouter

      【AI日報】今日AI領(lǐng)域重要動態(tài):1.百度發(fā)布文心快碼3.5及多模態(tài)AI程序員"文心快碼Comate Zulu",提升開發(fā)效率;2.字節(jié)跳動啟動"Top Seed"計劃,招募30名AI博士人才;3.DeepSeek開源R1T Chimera模型上線OpenRouter平臺;4.阿里AI工程師余亮獲"全國勞動模范"稱號;5.開源圖像編輯工具Step1X-Edit登陸Hugging Face,性能媲美GPT-4o;6.谷歌被曝每月向三星支付巨額資金預(yù)裝Gemini應(yīng)用;7.全球首個擴散語言模型ChatDLM即將開源;8.字節(jié)跳動推出提升大模型訓(xùn)練效率的QuaDMix框架;9.Adobe升級Firefly AI平臺,支持圖像視頻音頻創(chuàng)作;10.Kimi與財新傳媒達成內(nèi)容合作;11.巨人網(wǎng)絡(luò)《太空殺》接入騰訊AI技術(shù),生成超700萬AI玩家。

    • 字節(jié)和DeepSeek爭搶“天才少年”

      當(dāng)年輕人還在想著怎么靠AI賺錢時,AI已經(jīng)開始幫助老板提升身家了。近期胡潤研究院發(fā)布的《2025胡潤全球富豪榜》顯示,字節(jié)跳動創(chuàng)始人張一鳴取代“瓶裝水大王”鐘睒睒,成為中國新首富。對當(dāng)下的字節(jié)和張一鳴言,如果靠砸錢就能解決大模型的技術(shù)突破難題,那無疑將是一筆劃算的投資。

    • Trae國內(nèi)版怎么用?Trae IDE 內(nèi)置 MCP 市場配置使用指南

      字節(jié)跳動旗下Trae+IDE發(fā)布新版本,通過MCP協(xié)議實現(xiàn)AI智能體與外部工具的深度集成。MCP作為標準化橋梁,讓開發(fā)者能靈活接入Supabase、FireCrawl等第三方服務(wù),只需@符號即可調(diào)用智能體完成數(shù)據(jù)庫操作、文檔搜索等復(fù)雜任務(wù)。新版本內(nèi)置MCP市場,支持Token快速配置,并演示了如何通過Figma+AI自動生成前端代碼。該技術(shù)可應(yīng)用于Blender建模、K8s管理等多元場景,顯著提升開發(fā)效率。Trae+IDE將持續(xù)擴展工具生態(tài),推動AI協(xié)作開發(fā)新時代。

    • 誠意滿滿!小米為SU7 Ultra Club首批會員推出限定禮盒

      小米汽車這次真是誠意滿滿!SU7 Ultra Club首批會員收到了一份專屬的限定禮盒。里面的東西可不少:SU7 Ultra的1:43合金車模,做工精致,完全按照真車比例打造;除此之外,還有紐北成績限定車牌和冰箱貼,再加上專屬會員卡,這身份感瞬間拉滿。100%; word-break: break-word;"據(jù)悉,SU7 Ultra Club會員俱樂部是2月27日成立的,年費3999元,首批限量2000人,入會就能拿到6

    • 小米澎湃OS問題處理公告:小米14 Ultra影像風(fēng)格預(yù)設(shè)消失等已解決

      快科技4月21日消息,小米近日公布了對澎湃OS的問題處理進展,其中提到了小米15、14Ultra機型的體驗問題優(yōu)化情況,主要針對Beta版本系統(tǒng)。具體如下:已優(yōu)化問題Beta版本部分場景自動鎖屏的問題Beta版本部分場景充電與使用時長時間不準的問題Beta版本部分場景Xiaomi152.0.200.10版本徠卡水印不支持后期關(guān)閉的問題Beta版本部分場景Xiaomi14Ultra2.0.200.5版本影像風(fēng)格預(yù)設(shè)消失的問題處理中?

    • 雷軍曬小米15 UltraPPT功能:瞬間去掉屏紋

      今天下午,雷軍分享了15Ultra一項非常實用的功能。雷軍寫道:小米作為汽車行業(yè)新人,今天我第一次參加中國電動汽車百人會論壇。這一實用的功能,無疑將為用戶在記錄重要信息時提供極大的便利。

    • iPhone 17 Pro Max保護殼撞臉小米11 Ultra:外觀近乎一樣

      快科技4月15日消息,有博主在社交平臺上曬出了iPhone 17 Pro Max的保護殼,其攝像頭開孔跟小米11 Ultra近乎一致,因為兩款機型都是橫向大矩陣相機DECO設(shè)計,擁有極高的辨識度。不過兩款機型的按鍵開孔并不一致,小米11 Ultra的電源鍵、音量鍵位于同一側(cè),iPhone 17 Pro系列的電源鍵和音量鍵位于機身兩側(cè),并且iPhone還多了一枚拍照按鍵。這次iPhone 17 Pro系列不僅僅是改變了工業(yè)設(shè)計?

    • 反擊DeepSeek失敗!Llama 4效果不好,Meta承認有問題

      今天凌晨1點半,Meta生成式AI領(lǐng)導(dǎo)者AhmadAl-Dahle在社交平臺發(fā)布了一篇長文,對前天剛開源的Llama4質(zhì)疑進行了官方回應(yīng)。Ahmad表示,Llama4一開發(fā)完就發(fā)布了,所以,不同服務(wù)中模型質(zhì)量難免會有一些差異。由于關(guān)稅大戰(zhàn)的原因,Meta的股票遭遇重創(chuàng),他們也需要一個利好消息來拉升股票,現(xiàn)在適得其反。

    • 努比亞Z70S Ultra攝影師版官宣:今年唯一真全面屏Ultra

      快科技4月18日消息,今天,努比亞宣布努比亞AI雙旗艦新品發(fā)布會將于4月28日舉行,努比亞Z70S Ultra攝影師版和努比亞首款神秘新品將同時亮相。本次發(fā)布會的重頭戲是努比亞Z70S Ultra攝影師版,對比其它Ultra機型,Z70S Ultra攝影師版采用1.5K真全面屏形態(tài),是今年唯一一款真全面屏Ultra。據(jù)悉,這塊屏幕采用全屏藍鉆排列,通過FIAA極致壓縮走線技術(shù)實現(xiàn)超高屏占比,加上內(nèi)置UDC Ultra

    • OPPO Find X8 Ultra堪稱電子阿膠:拍照直出氣血感

      今日晚間,OPPOFindX8Ultra正式亮相。該機帶來全新夜神五攝影像系統(tǒng),包括5000萬超廣角、5000萬1英寸LYT900主攝、5000萬像素3X鏡頭、5000萬像素6X望遠鏡頭以及丹霞原彩鏡頭,同時配備OPPO超晶態(tài)藍玻璃,配合分區(qū)色溫感知技術(shù)和多模態(tài)協(xié)同計算技術(shù),一次性解決夜景人像細節(jié)糊、色彩偏、膚色怪的三大難題。根據(jù)官方實拍的對比樣張,F(xiàn)indX8Ultra能準確還原人臉的膚色以及人像背后的環(huán)境,然后分別處理,讓人像看上去更有氣血感”,相比之下,iPhone16ProMax的人像樣張噪點較多,膚色質(zhì)感跟OPPO有明顯差距。

    今日大家都在搜的詞: