中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

<td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>

<rp id="h1kkc"></rp>

<pre id="pb23m"></pre>

<label id="pb23m"></label><button id="pb23m"><legend id="pb23m"></legend></button>

微軟研究人員指出，并非所有token都符合需求

2024-04-12 16:02 · 稿源：站長之家

劃重點(diǎn):
?? RHO-1方法通過選擇性語言建模，專注訓(xùn)練與所需分布一致的有用token。
?? RHO-1的 SLM 方法可顯著提高數(shù)學(xué)任務(wù)的準(zhǔn)確性，表現(xiàn)優(yōu)異于傳統(tǒng)訓(xùn)練方法。
?? 未來工作包括將 SLM 推廣至其他領(lǐng)域，提高可擴(kuò)展性，探索多個(gè)參考模型減少過擬合等。

站長之家（ChinaZ.com）4月12日消息:微軟研究人員挑戰(zhàn)了語言模型(LM)預(yù)訓(xùn)練的傳統(tǒng)方法，該方法在訓(xùn)練語料庫中的所有token上均勻應(yīng)用下一個(gè)token預(yù)測(cè)損失。相反，他們提出了一種新的語言模型稱為 RHO-1，該模型利用選擇性語言建模(SLM)。

RHO-1方法通過選擇性訓(xùn)練與所需分布一致的有用token，而不是嘗試預(yù)測(cè)每一個(gè)下一個(gè)token。他們引入了 Rho-Math-v0.1模型，其中 Rho-Math-1B 和 Rho-Math-7B 在 MATH 數(shù)據(jù)集上分別實(shí)現(xiàn)了15.6% 和31.0% 的少樣本準(zhǔn)確率，僅使用預(yù)訓(xùn)練token的3% 與 DeepSeekMath 相匹配。

Rho-Math-1B-Interpreter 是第一個(gè)在 MATH 數(shù)據(jù)集上實(shí)現(xiàn)超過40% 準(zhǔn)確率的1B LLM。

Rho-Math-7B-Interpreter 在 MATH 數(shù)據(jù)集上實(shí)現(xiàn)52% 的準(zhǔn)確率，僅使用69k 個(gè)樣本進(jìn)行微調(diào)。

RHO-1的 SLM 方法涉及使用參考模型對(duì)預(yù)訓(xùn)練token進(jìn)行評(píng)分，并使用更加專注的損失對(duì)具有更高多余損失的token進(jìn)行語言模型訓(xùn)練。這種選擇性過程使 RHO-1能夠在持續(xù)預(yù)訓(xùn)練15B OpenWebMath 語料庫時(shí)，將9個(gè)數(shù)學(xué)任務(wù)的少樣本準(zhǔn)確率提高高達(dá)30%。

該模型在微調(diào)后在 MATH 數(shù)據(jù)集上實(shí)現(xiàn)了最先進(jìn)的結(jié)果，并且在80B 通用token預(yù)訓(xùn)練時(shí)，在15個(gè)不同任務(wù)中平均提升了6.8%。

傳統(tǒng)的訓(xùn)練方法通常使用啟發(fā)式和分類器在文檔級(jí)別上過濾數(shù)據(jù)，以提高數(shù)據(jù)質(zhì)量和模型性能。然而，即使高質(zhì)量的數(shù)據(jù)集可能包含對(duì)訓(xùn)練產(chǎn)生負(fù)面影響的嘈雜token。

SLM 方法直接解決了這個(gè)問題，通過專注于token級(jí)別，并在預(yù)訓(xùn)練期間消除不需要的token損失。

在研究中，SLM 在預(yù)訓(xùn)練期間選擇的token與數(shù)學(xué)相關(guān)，有效地調(diào)整了模型對(duì)原始語料庫的相關(guān)部分。研究人員在各個(gè)檢查點(diǎn)中調(diào)查了token過濾，發(fā)現(xiàn)后續(xù)檢查點(diǎn)選擇的token傾向于在訓(xùn)練的后期具有更高的困惑度，并在早期具有更低的困惑度。

討論部分強(qiáng)調(diào)了未來的工作，包括將 SLM 推廣至數(shù)學(xué)領(lǐng)域以外的領(lǐng)域，將該技術(shù)擴(kuò)展至更大的模型和數(shù)據(jù)集，以及探索在評(píng)分token時(shí)是否需要訓(xùn)練參考模型。

對(duì) SLM 的改進(jìn)可能包括重新加權(quán)token而不是選擇它們，以及使用多個(gè)參考模型減少過擬合。

SLM 可以擴(kuò)展到監(jiān)督微調(diào)，以解決數(shù)據(jù)集中的噪聲和分布不匹配，并通過訓(xùn)練一個(gè)強(qiáng)調(diào)幫助性、真實(shí)性和無害性的參考模型來獲得在預(yù)訓(xùn)練期間獲得本地對(duì)齊的基本模型。

rho:https://github.com/microsoft/rho

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

AI介入私域運(yùn)營，不僅提效，還省90%的token！

這樣的做法既融入了原有的工作流，又將AI的token消耗壓縮90%。類似需要“被動(dòng)回復(fù)”的環(huán)節(jié)都可以用AI客服來完成。

?私域流量 ?精準(zhǔn)營銷 ?AI客服
孫宇晨將出席迪拜Token2049 與特朗普次子共話加密未來

TRON創(chuàng)始人孫宇晨將于5月1日出席迪拜Token2049峰會(huì)，并與特朗普之子埃里克·特朗普進(jìn)行爐邊對(duì)話。此次對(duì)話將聚焦區(qū)塊鏈技術(shù)、加密資產(chǎn)未來趨勢(shì)及全球金融體系變革。

?TRON ?孫宇晨 ?Token2049
微軟砍刀部受挫！無限期推遲刪除WSUS驅(qū)動(dòng)同步功能：低估了用戶需求

微軟原本計(jì)劃于2025年4月18日停用WindowsServerUpdateServices驅(qū)動(dòng)程序同步服務(wù)，但這一計(jì)劃如今被宣布無限期推遲。WSUS是微軟為企業(yè)提供的更新服務(wù)，驅(qū)動(dòng)同步功能可以讓IT管理員在整個(gè)內(nèi)網(wǎng)中分發(fā)驅(qū)動(dòng)程序不需要進(jìn)行單獨(dú)的操作?！蔽④浽?024年6月首次宣布將棄用WSUS驅(qū)動(dòng)同步功能，并在2024年9月透露WSUS已被列入從WindowsServer2025開始不再開發(fā)或已移除的功能”名單。

?微軟 ?WSUS ?驅(qū)動(dòng)程序同步
BYDFi攜手Ledger推出限量版硬件錢包于TOKEN2049迪拜限量發(fā)放

加密貨幣交易所BYDFi在TOKEN2049迪拜大會(huì)上宣布與硬件錢包品牌Ledger合作推出限量版聯(lián)名款Ledger Nano X硬件錢包。該產(chǎn)品在保留原有安全性能基礎(chǔ)上加入BYDFi品牌設(shè)計(jì)元素，支持多種主流數(shù)字資產(chǎn)的離線存儲(chǔ)，能有效抵御網(wǎng)絡(luò)攻擊風(fēng)險(xiǎn)。展會(huì)現(xiàn)場(chǎng)參與者可通過互動(dòng)活動(dòng)免費(fèi)領(lǐng)取。BYDFi聯(lián)合創(chuàng)始人表示，此次合作體現(xiàn)了對(duì)用戶資產(chǎn)安全的一貫承諾。同時(shí)，BYDFi還展示了其鏈上交易工具M(jìn)oonX，該產(chǎn)品結(jié)合了CEX級(jí)交易性能和DEX透明度，是其"CEX+DEX"雙引擎戰(zhàn)略的關(guān)鍵成果。目前BYDFi服務(wù)覆蓋全球190多個(gè)國家和地區(qū)，擁有超100萬用戶。

?BYDFi ?Ledger ?Nano
VT Markets本周研究報(bào)告：市場(chǎng)驗(yàn)證“特朗普看跌期權(quán)”機(jī)制

2025年4月，特朗普政府激進(jìn)關(guān)稅政策引發(fā)全球市場(chǎng)劇烈震蕩。4月2日宣布對(duì)中國商品加征145%關(guān)稅后，標(biāo)普500指數(shù)三日暴跌16%。在零售巨頭CEO警告和財(cái)長施壓下，4月7日政府宣布90%關(guān)稅延期90天，22日又大幅削減對(duì)華關(guān)稅。市場(chǎng)隨即暴力反彈10%，VIX指數(shù)從60回落至29。報(bào)告指出"特朗普看跌期權(quán)"機(jī)制存在局限性：政策逆轉(zhuǎn)雖能短期穩(wěn)定市場(chǎng)，但若經(jīng)濟(jì)實(shí)質(zhì)損傷持續(xù)，反彈效應(yīng)?
薦兩大CEO多項(xiàng)分歧曝光，OpenAI與微軟的“最佳合作”要破裂？

OpenAI與微軟的"科技界最佳合作關(guān)系"出現(xiàn)裂痕。微軟6年來投資數(shù)十億美元推動(dòng)OpenAI發(fā)展，助其ChatGPT用戶突破5億；同時(shí)OpenAI為微軟提供尖端AI工具，使其股價(jià)翻倍。但雙方在算力供給、模型使用權(quán)和AGI研發(fā)進(jìn)度上分歧加劇。微軟秘密啟動(dòng)自研AI項(xiàng)目，挖角OpenAI對(duì)手蘇萊曼，耗資6.5億美元組建團(tuán)隊(duì)。OpenAI則可能觸發(fā)合同條款限制微軟接觸其最新技術(shù)。若OpenAI年底前未能完成?

?OpenAI ?微軟合作 ?生成式AI
速看！榕樹貸款如何精準(zhǔn)匹配你的資金需求

在生活中，資金需求常常不期而至，無論是創(chuàng)業(yè)啟動(dòng)、房屋裝修，還是應(yīng)對(duì)突發(fā)的醫(yī)療費(fèi)用，快速且精準(zhǔn)地獲取合適的資金支持至關(guān)重要。然而，傳統(tǒng)金融借貸往往面臨諸多痛點(diǎn)。比如，貸款產(chǎn)品選擇有限，用戶難以找到完全契合自身需求的額度與利率方案;申請(qǐng)流程繁瑣，需提交大量資料，耗費(fèi)大量時(shí)間和精力;審批時(shí)間漫長，急需資金時(shí)卻只能焦急等待，錯(cuò)過最佳時(shí)機(jī)。而榕

?榕樹貸款 ?貸款申請(qǐng) ?資金需求
REDMI王騰：做性能小屏是自嗨的偽需求

4月25日Redmi發(fā)布Turbo4 Pro手機(jī)，配備6.83英寸1.5K大屏，官方稱其為"最強(qiáng)1.5K大屏"。王騰表示在友商跟風(fēng)做小屏?xí)r，Redmi堅(jiān)持做旗艦大屏，認(rèn)為大屏視野更好、更適合游戲且電量更大。他指出小屏用戶更關(guān)注設(shè)計(jì)和手感，性能反而不是主要需求，并稱"做性能小屏更多是自嗨的偽需求"。此前小米15標(biāo)準(zhǔn)版銷量數(shù)據(jù)也顯示，小屏用戶多因手感購買。但小屏手機(jī)因空間限制，性能釋放較保守，這是用戶取舍的結(jié)果。王騰承認(rèn)喜歡設(shè)計(jì)、手感的用戶和游戲黨都可能選擇小屏，且小屏機(jī)型出門玩游戲更方便。

?REDMI ?Turbo4Pro ?1.5K屏幕
貝銳向日葵企業(yè)安全遠(yuǎn)控攻略：如何控制外部人員遠(yuǎn)控？

遠(yuǎn)程控制對(duì)于企業(yè)業(yè)務(wù)的賦能作用顯而易見，但另一方面，遠(yuǎn)程控制在企業(yè)信息安全方面有著天然的敏感性，企業(yè)引入的商用遠(yuǎn)控方案，必須具備完備的安全保障功能。貝銳向日葵作為國民級(jí)遠(yuǎn)程控制品牌，其企業(yè)遠(yuǎn)控方案就充分考慮了企業(yè)在安全方面的訴求，構(gòu)建了“事前防范-事中保護(hù)-事后記錄”的“全流程安全遠(yuǎn)控閉環(huán)”體系。這里，我們就簡(jiǎn)單介紹幾個(gè)該體系中“事前

?遠(yuǎn)程控制 ?信息安全 ?企業(yè)管理
被Teams替代！14年微軟通訊軟件Skype正式停運(yùn)

近年來，隨著Zoom、WhatsApp以及微軟自家的Teams平臺(tái)等競(jìng)爭(zhēng)對(duì)手獲得越來越多用戶的青睞，Skype的重要性逐漸下降，到2023年，其活躍用戶群已縮減至約3600萬。

?Skype ?Teams ?互聯(lián)網(wǎng)語音

熱文

3 天
7天

站長商機(jī)

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM

<li id="626e9"><tbody id="626e9"></tbody></li>

<bdo id="626e9"></bdo>