中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

    <td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>
    <rp id="h1kkc"></rp>
    首頁 > 業(yè)界 > 關(guān)鍵詞  > 大模型最新資訊  > 正文

    南加州大學(xué)提出通道式輕量級重編碼CLR 解決大語言模型災(zāi)難性遺忘問題

    2023-10-13 13:50 · 稿源:站長之家

    要點:

    1. 南加州大學(xué)和Google Research提出了通道式輕量級重編碼(Channel-wise Lightweight Reprogramming)方法,用于解決持續(xù)學(xué)習(xí)問題,通過在固定任務(wù)不變的模型背骨干中添加輕量級可訓(xùn)練模塊,對每層通道的特征圖進行重編程,以適應(yīng)新任務(wù),僅占0.6%的額外參數(shù)。

    2. 通道式輕量級重編碼方法采用動態(tài)網(wǎng)絡(luò)方式,可以持續(xù)學(xué)習(xí)多個新任務(wù)而不會出現(xiàn)災(zāi)難性遺忘,使模型在不同任務(wù)之間靈活轉(zhuǎn)換。

    3. 這項研究的動機是持續(xù)學(xué)習(xí)中的遺忘問題,提出了一種更輕量級但更強大的重編程方法,通過通道線性映射和卷積核的重編碼,使模型能夠適應(yīng)多個新任務(wù),實現(xiàn)更好的性能。

    站長之家(ChinaZ.com)10月13日 消息:在持續(xù)學(xué)習(xí)領(lǐng)域,南加州大學(xué)和Google Research提出了一項創(chuàng)新的方法,通道式輕量級重編碼(Channel-wise Lightweight Reprogramming,CLR),旨在解決模型在持續(xù)學(xué)習(xí)新任務(wù)時出現(xiàn)的災(zāi)難性遺忘問題。持續(xù)學(xué)習(xí)的關(guān)鍵挑戰(zhàn)是如何在學(xué)習(xí)新任務(wù)后仍然保持對舊任務(wù)的性能,而CLR方法提供了一種有前景的解決方案。

    與傳統(tǒng)的多任務(wù)學(xué)習(xí)不同,持續(xù)學(xué)習(xí)是在一個接一個的任務(wù)中進行學(xué)習(xí),模型需要逐個適應(yīng)新的任務(wù),同時盡量避免遺忘之前學(xué)到的知識。

    image.png

    • 論文地址: https://arxiv.org/pdf/2307.11386.pdf

    • 項目地址: https://github.com/gyhandy/Channel-wise-Lightweight-Reprogramming

    • 數(shù)據(jù)集地址: https://ilab.usc.edu/andy/skill102

    CLR的創(chuàng)新之處在于它通過在模型的固定骨干(backbone)中引入可訓(xùn)練的輕量級模塊,對每一層的通道特征圖進行重編程,使其適用于新任務(wù)。這些輕量級模塊僅占整個模型的0.6%額外參數(shù),但為每個新任務(wù)提供了定制的特征。這意味著模型可以連續(xù)學(xué)習(xí)無數(shù)個新任務(wù),而不會受到災(zāi)難性遺忘的困擾。

    image.png

    CLR方法采用了動態(tài)網(wǎng)絡(luò)的方式,通過通道線性映射對卷積核產(chǎn)生的特征圖進行重編程,實現(xiàn)了多個新任務(wù)之間的平滑切換。該方法的靈活性使其在持續(xù)學(xué)習(xí)中表現(xiàn)出色,即使面對眾多新任務(wù),每個輕量級模塊所需的訓(xùn)練參數(shù)仍然非常有限,這使得模型的規(guī)模保持相對較小。

    CLR方法通過引入輕量級重編程參數(shù),使模型能夠以更輕量級但更強大的方式適應(yīng)不同的新任務(wù)。它解決了持續(xù)學(xué)習(xí)中的遺忘問題,為模型提供了更好的性能和靈活性。

    通道式輕量級重編碼(CLR)方法為持續(xù)學(xué)習(xí)領(lǐng)域帶來了新的機會,使模型能夠在不斷學(xué)習(xí)新任務(wù)的同時,有效地保持對舊任務(wù)的性能,為多任務(wù)學(xué)習(xí)領(lǐng)域帶來了新的突破。這一創(chuàng)新方法有望為未來的持續(xù)學(xué)習(xí)研究和應(yīng)用提供更多的可能性。

    舉報

    • 相關(guān)推薦
    • 時空壺接入大語言模型,跨語言溝通已成翻譯的藝術(shù)

      在當(dāng)今全球化浪潮中,跨語言溝通的需求如潮水般洶涌。從商務(wù)領(lǐng)域的跨國談判,到文化交流中的思想碰撞,高效、精準(zhǔn)的語言翻譯成為關(guān)鍵橋梁。隨著技術(shù)的不斷發(fā)展與迭代,時空壺有望持續(xù)引領(lǐng)行業(yè)變革,推動全球交流合作邁向新的高度,真正實現(xiàn)跨越語言障礙,讓世界溝通無阻。

    • 為什么要使用MCP?MCP模型上下文協(xié)議能解決什么問題?

      在當(dāng)今數(shù)字化時代,AI應(yīng)用的開發(fā)和部署正面臨著一個關(guān)鍵挑戰(zhàn):如何將AI技術(shù)與現(xiàn)有的服務(wù)和系統(tǒng)高效集成。為了解決這一難題,MCP應(yīng)運生。AIbase的MCP資源網(wǎng)站還提供了詳細的開發(fā)文檔和教程,幫助開發(fā)者快速上手并深入學(xué)習(xí)MCP技術(shù)。

    • OpenAI 要砸 30 億美金收購 AI 編碼工具 Windsurf

      若收購成功,OpenAI 將直接與在快速發(fā)展的 AI 編碼領(lǐng)域提供服務(wù)的 Anthropic、微軟旗下的 GitHub、Anyscale 等公司展開競爭……

    • CADDX卡德克斯亮相北京模型博覽會,開啟沉浸飛行新時代

      2025 年 4 月 18 日至 20 日,全球FPV技術(shù)領(lǐng)導(dǎo)者CADDX卡德克斯將攜全系FPV無人機及智能穿戴設(shè)備全矩陣產(chǎn)品亮相第 23 屆中國國際模型博覽會。作為亞洲最具影響力的模型行業(yè)展會,此次盛會為卡德克斯提供了展示其技術(shù)實力與品牌愿景的絕佳機會。通過精心設(shè)計的沉浸式體驗區(qū),卡德克斯將為觀眾帶來前所未有的FPV飛行科技互動,重新定義未來消費電子與娛樂的邊界。CADDX卡德克?

    • UniToken:多模態(tài)AI的“全能選手”,一次編碼搞定圖文理解與圖像生成

      復(fù)旦大學(xué)與美團研究者提出UniToken框架,首次在統(tǒng)一模型中實現(xiàn)圖文理解與生成任務(wù)的"雙優(yōu)表現(xiàn)"。該方案融合連續(xù)和離散視覺編碼,有效解決了傳統(tǒng)多模態(tài)建模中的"任務(wù)干擾"和"表示割裂"問題。通過三階段訓(xùn)練策略(視覺語義對齊、多任務(wù)聯(lián)合訓(xùn)練、指令強化微調(diào)),UniToken在多個基準(zhǔn)測試中性能超越專用模型。其創(chuàng)新性體現(xiàn)在:1)統(tǒng)一的雙邊視覺編碼

    • 提升大模型自動修Bug能力 豆包正式開源首個多語言類SWE數(shù)據(jù)集

      今日,字節(jié)跳動豆包大模型團隊宣布,正式開源首個多語言類SWE數(shù)據(jù)集Multi-SWE-bench,可用于評估和提升大模型自動修Bug”能力。在SWE-bench基礎(chǔ)上,Multi-SWE-bench首次覆蓋Python之外的7種主流編程語言,是真正面向全棧工程”的評測基準(zhǔn)。相比于以往聚焦Python的單語言任務(wù),Multi-SWE-bench更貼近現(xiàn)實中的多語言開發(fā)場景,也更能反映當(dāng)前模型在自動化軟件工程”方向上的實際能力邊界。

    • 九為健康聯(lián)合華為云發(fā)布神農(nóng)中醫(yī)大模型智能體,解如何用大模型重構(gòu)“望聞問切”

      2025 年 4 月 11 日,在華為云生態(tài)大會上,浙江九為健康科技股份有限公司(以下簡稱"九為健康")正式發(fā)布基于華為云盤古大模型的"九為神農(nóng)中醫(yī)大模型智能體"。該解決方案依托AI技術(shù),系統(tǒng)性攻克中醫(yī)藥研發(fā)周期長、作用機制解析困難、個性化方案制定復(fù)雜等產(chǎn)業(yè)難題,通過智能化手段推動中醫(yī)藥現(xiàn)代化進程,為醫(yī)藥全產(chǎn)業(yè)鏈提供覆蓋研發(fā)、診療及健康管理的全流程智能服?

    • 偉世通×火山引擎:發(fā)布基于豆包大模型的智能座艙解決方案

      2025年上海車展期間,火山引擎與偉世通聯(lián)合發(fā)布基于AI大模型的下一代智能座艙解決方案。該方案融合豆包大模型AI能力和偉世通高性能域控平臺,通過端云協(xié)同架構(gòu)和多模態(tài)交互技術(shù),實現(xiàn)離線功能閉環(huán)運行和快速響應(yīng)。方案接入火山豐富的內(nèi)容生態(tài),支持個性化推薦和"千人千面"自適應(yīng)設(shè)計,同時具備多模態(tài)交互能力,實現(xiàn)更自然的人機交互。雙方還將共同探索AI大模型在智能座艙場景的優(yōu)化適配,助力車企打造差異化智能座艙體驗。

    • OpenAI推出輕量版Deep Research,所有用戶可用!

      OpenAI 稱,由于很多用戶喜歡使用 Deep Research 功能,所以將推出輕量版 Deep Research,且此版本面向所有用戶開放……

    • 行業(yè)案例 | PCB 板多方案

      在傳統(tǒng)的PCB生產(chǎn)流程中需要人工對各類元器件的標(biāo)號進行檢查、標(biāo)記、追溯,而隨著工業(yè)4. 0 時代的到來,大多企業(yè)會選擇借助機器視覺技術(shù)或固定式讀碼器進行自動采集信息。在PCB生產(chǎn)過程中需要實現(xiàn)一次性讀取PCB板上多個二維碼,完成信息上傳系統(tǒng)追溯,從而實現(xiàn)提高生產(chǎn)的效率,節(jié)約了勞動成本。讀碼挑戰(zhàn):1、生產(chǎn)過程中的打碼質(zhì)量不夠高,導(dǎo)致對比度不足,從而影響?