中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

    <td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>
    <rp id="h1kkc"></rp>
    首頁 > 業(yè)界 > 關(guān)鍵詞  > AI數(shù)據(jù)最新資訊  > 正文

    微軟研究人員指出,并非所有token都符合需求

    2024-04-12 16:02 · 稿源:站長之家

    劃重點(diǎn):

    ?? RHO-1方法通過選擇性語言建模,專注訓(xùn)練與所需分布一致的有用token。

    ?? RHO-1的 SLM 方法可顯著提高數(shù)學(xué)任務(wù)的準(zhǔn)確性,表現(xiàn)優(yōu)異于傳統(tǒng)訓(xùn)練方法。

    ?? 未來工作包括將 SLM 推廣至其他領(lǐng)域,提高可擴(kuò)展性,探索多個(gè)參考模型減少過擬合等。

    站長之家(ChinaZ.com)4月12日 消息:微軟研究人員挑戰(zhàn)了語言模型(LM)預(yù)訓(xùn)練的傳統(tǒng)方法,該方法在訓(xùn)練語料庫中的所有token上均勻應(yīng)用下一個(gè)token預(yù)測(cè)損失。相反,他們提出了一種新的語言模型稱為 RHO-1,該模型利用選擇性語言建模(SLM)。

    RHO-1方法通過選擇性訓(xùn)練與所需分布一致的有用token,而不是嘗試預(yù)測(cè)每一個(gè)下一個(gè)token。他們引入了 Rho-Math-v0.1模型,其中 Rho-Math-1B 和 Rho-Math-7B 在 MATH 數(shù)據(jù)集上分別實(shí)現(xiàn)了15.6% 和31.0% 的少樣本準(zhǔn)確率,僅使用預(yù)訓(xùn)練token的3% 與 DeepSeekMath 相匹配。

    Rho-Math-1B-Interpreter 是第一個(gè)在 MATH 數(shù)據(jù)集上實(shí)現(xiàn)超過40% 準(zhǔn)確率的1B LLM。

    Rho-Math-7B-Interpreter 在 MATH 數(shù)據(jù)集上實(shí)現(xiàn)52% 的準(zhǔn)確率,僅使用69k 個(gè)樣本進(jìn)行微調(diào)。

    RHO-1的 SLM 方法涉及使用參考模型對(duì)預(yù)訓(xùn)練token進(jìn)行評(píng)分,并使用更加專注的損失對(duì)具有更高多余損失的token進(jìn)行語言模型訓(xùn)練。這種選擇性過程使 RHO-1能夠在持續(xù)預(yù)訓(xùn)練15B OpenWebMath 語料庫時(shí),將9個(gè)數(shù)學(xué)任務(wù)的少樣本準(zhǔn)確率提高高達(dá)30%。

    該模型在微調(diào)后在 MATH 數(shù)據(jù)集上實(shí)現(xiàn)了最先進(jìn)的結(jié)果,并且在80B 通用token預(yù)訓(xùn)練時(shí),在15個(gè)不同任務(wù)中平均提升了6.8%。

    image.png

    傳統(tǒng)的訓(xùn)練方法通常使用啟發(fā)式和分類器在文檔級(jí)別上過濾數(shù)據(jù),以提高數(shù)據(jù)質(zhì)量和模型性能。然而,即使高質(zhì)量的數(shù)據(jù)集可能包含對(duì)訓(xùn)練產(chǎn)生負(fù)面影響的嘈雜token。

    SLM 方法直接解決了這個(gè)問題,通過專注于token級(jí)別,并在預(yù)訓(xùn)練期間消除不需要的token損失。

    在研究中,SLM 在預(yù)訓(xùn)練期間選擇的token與數(shù)學(xué)相關(guān),有效地調(diào)整了模型對(duì)原始語料庫的相關(guān)部分。研究人員在各個(gè)檢查點(diǎn)中調(diào)查了token過濾,發(fā)現(xiàn)后續(xù)檢查點(diǎn)選擇的token傾向于在訓(xùn)練的后期具有更高的困惑度,并在早期具有更低的困惑度。

    image.png

    討論部分強(qiáng)調(diào)了未來的工作,包括將 SLM 推廣至數(shù)學(xué)領(lǐng)域以外的領(lǐng)域,將該技術(shù)擴(kuò)展至更大的模型和數(shù)據(jù)集,以及探索在評(píng)分token時(shí)是否需要訓(xùn)練參考模型。

    對(duì) SLM 的改進(jìn)可能包括重新加權(quán)token而不是選擇它們,以及使用多個(gè)參考模型減少過擬合。

    SLM 可以擴(kuò)展到監(jiān)督微調(diào),以解決數(shù)據(jù)集中的噪聲和分布不匹配,并通過訓(xùn)練一個(gè)強(qiáng)調(diào)幫助性、真實(shí)性和無害性的參考模型來獲得在預(yù)訓(xùn)練期間獲得本地對(duì)齊的基本模型。

    rho:https://github.com/microsoft/rho

    舉報(bào)

    • 相關(guān)推薦
    • AI介入私域運(yùn)營,不僅提效,還省90%的token!

      這樣的做法既融入了原有的工作流,又將AI的token消耗壓縮90%。類似需要“被動(dòng)回復(fù)”的環(huán)節(jié)都可以用AI客服來完成。

    • 孫宇晨將出席迪拜Token2049 與特朗普次子共話加密未來

      TRON創(chuàng)始人孫宇晨將于5月1日出席迪拜Token2049峰會(huì),并與特朗普之子埃里克·特朗普進(jìn)行爐邊對(duì)話。此次對(duì)話將聚焦區(qū)塊鏈技術(shù)、加密資產(chǎn)未來趨勢(shì)及全球金融體系變革。

    • 微軟砍刀部受挫!無限期推遲刪除WSUS驅(qū)動(dòng)同步功能:低估了用戶需求

      微軟原本計(jì)劃于2025年4月18日停用WindowsServerUpdateServices驅(qū)動(dòng)程序同步服務(wù),但這一計(jì)劃如今被宣布無限期推遲。WSUS是微軟為企業(yè)提供的更新服務(wù),驅(qū)動(dòng)同步功能可以讓IT管理員在整個(gè)內(nèi)網(wǎng)中分發(fā)驅(qū)動(dòng)程序不需要進(jìn)行單獨(dú)的操作?!蔽④浽?024年6月首次宣布將棄用WSUS驅(qū)動(dòng)同步功能,并在2024年9月透露WSUS已被列入從WindowsServer2025開始不再開發(fā)或已移除的功能”名單。

    • BYDFi攜手Ledger推出限量版硬件錢包 于TOKEN2049迪拜限量發(fā)放

      加密貨幣交易所BYDFi在TOKEN2049迪拜大會(huì)上宣布與硬件錢包品牌Ledger合作推出限量版聯(lián)名款Ledger Nano X硬件錢包。該產(chǎn)品在保留原有安全性能基礎(chǔ)上加入BYDFi品牌設(shè)計(jì)元素,支持多種主流數(shù)字資產(chǎn)的離線存儲(chǔ),能有效抵御網(wǎng)絡(luò)攻擊風(fēng)險(xiǎn)。展會(huì)現(xiàn)場(chǎng)參與者可通過互動(dòng)活動(dòng)免費(fèi)領(lǐng)取。BYDFi聯(lián)合創(chuàng)始人表示,此次合作體現(xiàn)了對(duì)用戶資產(chǎn)安全的一貫承諾。同時(shí),BYDFi還展示了其鏈上交易工具M(jìn)oonX,該產(chǎn)品結(jié)合了CEX級(jí)交易性能和DEX透明度,是其"CEX+DEX"雙引擎戰(zhàn)略的關(guān)鍵成果。目前BYDFi服務(wù)覆蓋全球190多個(gè)國家和地區(qū),擁有超100萬用戶。

    • VT Markets本周研究報(bào)告:市場(chǎng)驗(yàn)證“特朗普看跌期權(quán)”機(jī)制

      2025年4月,特朗普政府激進(jìn)關(guān)稅政策引發(fā)全球市場(chǎng)劇烈震蕩。4月2日宣布對(duì)中國商品加征145%關(guān)稅后,標(biāo)普500指數(shù)三日暴跌16%。在零售巨頭CEO警告和財(cái)長施壓下,4月7日政府宣布90%關(guān)稅延期90天,22日又大幅削減對(duì)華關(guān)稅。市場(chǎng)隨即暴力反彈10%,VIX指數(shù)從60回落至29。報(bào)告指出"特朗普看跌期權(quán)"機(jī)制存在局限性:政策逆轉(zhuǎn)雖能短期穩(wěn)定市場(chǎng),但若經(jīng)濟(jì)實(shí)質(zhì)損傷持續(xù),反彈效應(yīng)?

    • 兩大CEO多項(xiàng)分歧曝光,OpenAI與微軟的“最佳作”要破裂?

      OpenAI與微軟的"科技界最佳合作關(guān)系"出現(xiàn)裂痕。微軟6年來投資數(shù)十億美元推動(dòng)OpenAI發(fā)展,助其ChatGPT用戶突破5億;同時(shí)OpenAI為微軟提供尖端AI工具,使其股價(jià)翻倍。但雙方在算力供給、模型使用權(quán)和AGI研發(fā)進(jìn)度上分歧加劇。微軟秘密啟動(dòng)自研AI項(xiàng)目,挖角OpenAI對(duì)手蘇萊曼,耗資6.5億美元組建團(tuán)隊(duì)。OpenAI則可能觸發(fā)合同條款限制微軟接觸其最新技術(shù)。若OpenAI年底前未能完成?

    • 速看!榕樹貸款如何精準(zhǔn)匹配你的資金需求

      在生活中,資金需求常常不期而至,無論是創(chuàng)業(yè)啟動(dòng)、房屋裝修,還是應(yīng)對(duì)突發(fā)的醫(yī)療費(fèi)用,快速且精準(zhǔn)地獲取合適的資金支持至關(guān)重要。然而,傳統(tǒng)金融借貸往往面臨諸多痛點(diǎn)。比如,貸款產(chǎn)品選擇有限,用戶難以找到完全契合自身需求的額度與利率方案;申請(qǐng)流程繁瑣,需提交大量資料,耗費(fèi)大量時(shí)間和精力;審批時(shí)間漫長,急需資金時(shí)卻只能焦急等待,錯(cuò)過最佳時(shí)機(jī)。而榕

    • REDMI王騰:做性能小屏是自嗨的偽需求

      4月25日Redmi發(fā)布Turbo4 Pro手機(jī),配備6.83英寸1.5K大屏,官方稱其為"最強(qiáng)1.5K大屏"。王騰表示在友商跟風(fēng)做小屏?xí)r,Redmi堅(jiān)持做旗艦大屏,認(rèn)為大屏視野更好、更適合游戲且電量更大。他指出小屏用戶更關(guān)注設(shè)計(jì)和手感,性能反而不是主要需求,并稱"做性能小屏更多是自嗨的偽需求"。此前小米15標(biāo)準(zhǔn)版銷量數(shù)據(jù)也顯示,小屏用戶多因手感購買。但小屏手機(jī)因空間限制,性能釋放較保守,這是用戶取舍的結(jié)果。王騰承認(rèn)喜歡設(shè)計(jì)、手感的用戶和游戲黨都可能選擇小屏,且小屏機(jī)型出門玩游戲更方便。

    • 貝銳向日葵企業(yè)安全遠(yuǎn)控攻略:如何控制外部人員遠(yuǎn)控?

      遠(yuǎn)程控制對(duì)于企業(yè)業(yè)務(wù)的賦能作用顯而易見,但另一方面,遠(yuǎn)程控制在企業(yè)信息安全方面有著天然的敏感性,企業(yè)引入的商用遠(yuǎn)控方案,必須具備完備的安全保障功能。貝銳向日葵作為國民級(jí)遠(yuǎn)程控制品牌,其企業(yè)遠(yuǎn)控方案就充分考慮了企業(yè)在安全方面的訴求,構(gòu)建了“事前防范-事中保護(hù)-事后記錄”的“全流程安全遠(yuǎn)控閉環(huán)”體系。這里,我們就簡(jiǎn)單介紹幾個(gè)該體系中“事前

    • Teams替代!14年微軟通訊軟件Skype正式停運(yùn)

      近年來,隨著Zoom、WhatsApp以及微軟自家的Teams平臺(tái)等競(jìng)爭(zhēng)對(duì)手獲得越來越多用戶的青睞,Skype的重要性逐漸下降,到2023年,其活躍用戶群已縮減至約3600萬。

    熱文

    • 3 天
    • 7天