中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

<td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>

<rp id="h1kkc"></rp>

<small id="8cjhf"><tbody id="8cjhf"></tbody></small>

<track id="8cjhf"><tbody id="8cjhf"></tbody></track>

<i id="8cjhf"><ins id="8cjhf"></ins></i>

字節(jié)Seed 團隊推出 PHD-Transformer，成功擴展預(yù)訓(xùn)練長度，解決 KV 緩存問題！

2025-04-28 16:20 · 來源： AIbase基地

近日，字節(jié)跳動的 Seed 團隊在人工智能領(lǐng)域再傳佳音，推出了一種新型的 PHD-Transformer（Parallel Hidden Decoding Transformer），這項創(chuàng)新突破了預(yù)訓(xùn)練長度的限制，有效解決了推理過程中的 KV 緩存膨脹問題。隨著大型推理模型的迅速發(fā)展，研究人員在后訓(xùn)練階段嘗試通過強化學(xué)習(xí)方法來生成更長的推理鏈，并在復(fù)雜的推理任務(wù)上取得了顯著成果。受到啟發(fā)，字節(jié) Seed 團隊決定探索在預(yù)訓(xùn)練階段進行長度擴展的可能性。

傳統(tǒng)的長度擴展方法常常涉及在序列中插入文本或潛在向量，這些方式往往導(dǎo)致 KV 緩存占用過多內(nèi)存，推理速度慢。而 PHD-Transformer 則采用了一種更為簡便的策略 —— 直接重復(fù)輸入的 tokens。盡管這種方法在訓(xùn)練損失和模型性能上有明顯的提升，卻也帶來了 KV 緩存線性增長、內(nèi)存壓力加大和解碼延遲等新問題。

為了解決這些挑戰(zhàn)，PHD-Transformer 通過創(chuàng)新的 KV 緩存管理策略，保留了與原始 Transformer 相同的緩存大小。在推理時，PHD-Transformer 只保留由原始 tokens 生成的 KV 緩存，而對重復(fù)的 tokens 則在預(yù)測后立即丟棄，顯著加快了推理速度。此外，研究團隊還引入了滑動窗口注意力機制，稱之為 PHD-SWA，以保持局部滑動窗口緩存的性能優(yōu)勢。為進一步優(yōu)化預(yù)填充時間，研究者提出了逐塊滑動窗口注意力機制 PHD-CSWA，限制了每個塊內(nèi)的順序依賴，從而大幅縮短了預(yù)填充時間。

在一系列實驗中，PHD-CSWA 表現(xiàn)出色，在多個公開基準測試集上均實現(xiàn)了準確率的提升。研究團隊表示，PHD-CSWA 在保持原有效率的同時，為模型帶來了更大的性能提升，標志著在大規(guī)模推理任務(wù)中，預(yù)訓(xùn)練長度擴展取得了實質(zhì)性進展。

相關(guān)推薦

AI日報：國內(nèi)首個多模態(tài)AI程序員上崗；字節(jié)啟動Top Seed計劃招募AI人才；DeepSeek R1T Chimera上線OpenRouter

【AI日報】今日AI領(lǐng)域重要動態(tài)：1.百度發(fā)布文心快碼3.5及多模態(tài)AI程序員"文心快碼Comate Zulu"，提升開發(fā)效率；2.字節(jié)跳動啟動"Top Seed"計劃，招募30名AI博士人才；3.DeepSeek開源R1T Chimera模型上線OpenRouter平臺；4.阿里AI工程師余亮獲"全國勞動模范"稱號；5.開源圖像編輯工具Step1X-Edit登陸Hugging Face，性能媲美GPT-4o；6.谷歌被曝每月向三星支付巨額資金預(yù)裝Gemini應(yīng)用；7.全球首個擴散語言模型ChatDLM即將開源；8.字節(jié)跳動推出提升大模型訓(xùn)練效率的QuaDMix框架；9.Adobe升級Firefly AI平臺，支持圖像視頻音頻創(chuàng)作；10.Kimi與財新傳媒達成內(nèi)容合作；11.巨人網(wǎng)絡(luò)《太空殺》接入騰訊AI技術(shù)，生成超700萬AI玩家。

?人工智能 ?AI編程工具 ?多模態(tài)交互
薦字節(jié)和DeepSeek爭搶“天才少年”

當(dāng)年輕人還在想著怎么靠AI賺錢時，AI已經(jīng)開始幫助老板提升身家了。近期胡潤研究院發(fā)布的《2025胡潤全球富豪榜》顯示，字節(jié)跳動創(chuàng)始人張一鳴取代“瓶裝水大王”鐘睒睒，成為中國新首富。對當(dāng)下的字節(jié)和張一鳴言，如果靠砸錢就能解決大模型的技術(shù)突破難題，那無疑將是一筆劃算的投資。

?AI賺錢 ?年輕人 ?首富爭奪戰(zhàn)
Trae國內(nèi)版怎么用？Trae IDE 內(nèi)置 MCP 市場配置使用指南

字節(jié)跳動旗下Trae+IDE發(fā)布新版本，通過MCP協(xié)議實現(xiàn)AI智能體與外部工具的深度集成。MCP作為標準化橋梁，讓開發(fā)者能靈活接入Supabase、FireCrawl等第三方服務(wù)，只需@符號即可調(diào)用智能體完成數(shù)據(jù)庫操作、文檔搜索等復(fù)雜任務(wù)。新版本內(nèi)置MCP市場，支持Token快速配置，并演示了如何通過Figma+AI自動生成前端代碼。該技術(shù)可應(yīng)用于Blender建模、K8s管理等多元場景，顯著提升開發(fā)效率。Trae+IDE將持續(xù)擴展工具生態(tài)，推動AI協(xié)作開發(fā)新時代。

?字節(jié)跳動 ?Trae ?IDE
誠意滿滿！小米為SU7 Ultra Club首批會員推出限定禮盒

小米汽車這次真是誠意滿滿！SU7 Ultra Club首批會員收到了一份專屬的限定禮盒。里面的東西可不少：SU7 Ultra的1:43合金車模，做工精致，完全按照真車比例打造；除此之外，還有紐北成績限定車牌和冰箱貼，再加上專屬會員卡，這身份感瞬間拉滿。100%; word-break: break-word;"據(jù)悉，SU7 Ultra Club會員俱樂部是2月27日成立的，年費3999元，首批限量2000人，入會就能拿到6
小米澎湃OS問題處理公告：小米14 Ultra影像風(fēng)格預(yù)設(shè)消失等已解決

快科技4月21日消息，小米近日公布了對澎湃OS的問題處理進展，其中提到了小米15、14Ultra機型的體驗問題優(yōu)化情況，主要針對Beta版本系統(tǒng)。具體如下:已優(yōu)化問題Beta版本部分場景自動鎖屏的問題Beta版本部分場景充電與使用時長時間不準的問題Beta版本部分場景Xiaomi152.0.200.10版本徠卡水印不支持后期關(guān)閉的問題Beta版本部分場景Xiaomi14Ultra2.0.200.5版本影像風(fēng)格預(yù)設(shè)消失的問題處理中?

?小米 ?澎湃OS ?Beta版本
雷軍曬小米15 Ultra拍PPT功能：瞬間去掉屏紋

今天下午，雷軍分享了15Ultra一項非常實用的功能。雷軍寫道：小米作為汽車行業(yè)新人，今天我第一次參加中國電動汽車百人會論壇。這一實用的功能，無疑將為用戶在記錄重要信息時提供極大的便利。

?雷軍 ?小米15 ?Ultra
iPhone 17 Pro Max保護殼撞臉小米11 Ultra：外觀近乎一樣

快科技4月15日消息，有博主在社交平臺上曬出了iPhone 17 Pro Max的保護殼，其攝像頭開孔跟小米11 Ultra近乎一致，因為兩款機型都是橫向大矩陣相機DECO設(shè)計，擁有極高的辨識度。不過兩款機型的按鍵開孔并不一致，小米11 Ultra的電源鍵、音量鍵位于同一側(cè)，iPhone 17 Pro系列的電源鍵和音量鍵位于機身兩側(cè)，并且iPhone還多了一枚拍照按鍵。這次iPhone 17 Pro系列不僅僅是改變了工業(yè)設(shè)計?

?iPhone ?17 ?Pro
薦反擊DeepSeek失敗！Llama 4效果不好，Meta承認有問題

今天凌晨1點半，Meta生成式AI領(lǐng)導(dǎo)者AhmadAl-Dahle在社交平臺發(fā)布了一篇長文，對前天剛開源的Llama4質(zhì)疑進行了官方回應(yīng)。Ahmad表示，Llama4一開發(fā)完就發(fā)布了，所以，不同服務(wù)中模型質(zhì)量難免會有一些差異。由于關(guān)稅大戰(zhàn)的原因，Meta的股票遭遇重創(chuàng)，他們也需要一個利好消息來拉升股票，現(xiàn)在適得其反。

?Meta ?Llama4 ?生成式AI
努比亞Z70S Ultra攝影師版官宣：今年唯一真全面屏Ultra

快科技4月18日消息，今天，努比亞宣布努比亞AI雙旗艦新品發(fā)布會將于4月28日舉行，努比亞Z70S Ultra攝影師版和努比亞首款神秘新品將同時亮相。本次發(fā)布會的重頭戲是努比亞Z70S Ultra攝影師版，對比其它Ultra機型，Z70S Ultra攝影師版采用1.5K真全面屏形態(tài)，是今年唯一一款真全面屏Ultra。據(jù)悉，這塊屏幕采用全屏藍鉆排列，通過FIAA極致壓縮走線技術(shù)實現(xiàn)超高屏占比，加上內(nèi)置UDC Ultra

?努比亞 ?AI雙旗艦 ?Z70S
OPPO Find X8 Ultra堪稱電子阿膠：拍照直出氣血感

今日晚間，OPPOFindX8Ultra正式亮相。該機帶來全新夜神五攝影像系統(tǒng)，包括5000萬超廣角、5000萬1英寸LYT900主攝、5000萬像素3X鏡頭、5000萬像素6X望遠鏡頭以及丹霞原彩鏡頭，同時配備OPPO超晶態(tài)藍玻璃，配合分區(qū)色溫感知技術(shù)和多模態(tài)協(xié)同計算技術(shù)，一次性解決夜景人像細節(jié)糊、色彩偏、膚色怪的三大難題。根據(jù)官方實拍的對比樣張，F(xiàn)indX8Ultra能準確還原人臉的膚色以及人像背后的環(huán)境，然后分別處理，讓人像看上去更有氣血感”，相比之下，iPhone16ProMax的人像樣張噪點較多，膚色質(zhì)感跟OPPO有明顯差距。

?OPPO ?Find ?X8

今日大家都在搜的詞：

熱文

3 天
7天

站長商機

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM

<rp id="crxsn"><tbody id="crxsn"></tbody></rp>

<small id="crxsn"><tbody id="crxsn"></tbody></small>