清華發(fā)布SmartMoE：支持用戶一鍵實現(xiàn) MoE 模型分布式訓練

2023-08-08 11:43 · 稿源：站長之家

站長之家（ChinaZ.com）8月8日消息:清華大學計算機系 PACMAN 實驗室發(fā)布了一種稀疏大模型訓練系統(tǒng) SmartMoE，該系統(tǒng)支持用戶一鍵實現(xiàn) Mixture-of-Experts（MoE）模型的分布式訓練，并通過自動搜索并行策略來提高訓練性能。

論文地址:https://www.usenix.org/system/files/atc23-zhai.pdf

項目地址:https://github.com/zms1999/SmartMoE

MoE 是一種模型稀疏化技術，通過將小模型轉(zhuǎn)化為多個稀疏激活的小模型來擴展模型參數(shù)量。然而，傳統(tǒng)的專家并行技術在訓練 MoE 模型時存在性能問題，因為稀疏激活模式導致節(jié)點間不規(guī)則的 all-to-all 通信增加延遲和計算負載不均。

為了解決這些問題，SmartMoE 系統(tǒng)設計了專家放置策略和自動并行算法。通過對常用并行策略的支持和動態(tài)負載均衡，SmartMoE 系統(tǒng)在性能測試中表現(xiàn)出較高的加速比。

該系統(tǒng)的特點包括:

支持常用并行策略:SmartMoE 系統(tǒng)對數(shù)據(jù)并行、流水線并行、模型并行和專家并行等四種并行策略進行了全面的支持，并允許用戶任意組合這些策略。
專家放置策略:為了處理 MoE 模型的動態(tài)計算負載，SmartMoE 系統(tǒng)設計了專家放置策略，根據(jù)當前負載調(diào)整專家的放置順序，實現(xiàn)節(jié)點間的負載均衡。
兩階段自動并行算法:為了提高 MoE 模型復雜混合并行策略的易用性，SmartMoE 系統(tǒng)設計了一套輕量級且有效的兩階段自動并行算法。這個算法將自動并行搜索過程分為訓練開始前的搜索和訓練過程中的動態(tài)調(diào)整兩個階段，以減少搜索的開銷。
高性能:在性能測試中，SmartMoE 在不同模型結構、集群環(huán)境和規(guī)模下都表現(xiàn)出優(yōu)異的性能。相較于之前的 FasterMoE 系統(tǒng)，SmartMoE 能夠?qū)崿F(xiàn)高達1.88倍的加速比。

總之，SmartMoE 是一種可以一鍵實現(xiàn)高性能 MoE 稀疏大模型分布式訓練的系統(tǒng)，具有支持多種并行策略、專家放置策略和兩階段自動并行算法的特點。通過這些特點，SmartMoE 系統(tǒng)能夠提高 MoE 模型的易用性和訓練性能，助力 MoE 大模型的發(fā)展。

（舉報）

相關推薦

關鍵詞：

薦剛剛，商湯發(fā)布第六代大模型：6000億參數(shù)多模態(tài)MoE，中長視頻直接可推理

現(xiàn)在的國產(chǎn)AI應用，一口氣看好幾分鐘的視頻，都可以直接做推理和解析了!瞧~只需“喂”上一段柯南片段，AI就搖身一變成“名偵探”做剖析:它會對整個視頻的內(nèi)容先做一個總結，再按照秒級，對視頻片段做內(nèi)容上的推演。商湯科技聯(lián)合創(chuàng)始人楊帆認為:銀河通用合伙人、大模型負責人張直政表示:除此之外，上海交通大學副教授閆維新對這個問題的看法是:總言之，商湯作為國?

?國產(chǎn)AI ?視頻解析 ?智能剪輯
年度評選！itc保倫股份榮獲“分布式處理十大品牌”殊榮

國內(nèi)知名的音視頻行業(yè)整體解決方案提供商——廣東保倫電子股份有限公司憑借卓越的產(chǎn)品品質(zhì)、強大的品牌實力以及廣泛的市場認可度榮獲2024年度“分布式處理十大品牌”。自成立以來，itc保倫股份始終專注于分布式綜合管理平臺和KVM坐席協(xié)作系統(tǒng)的研發(fā)、設計、生產(chǎn)和應用，多次引領行業(yè)變革，先后參與制定了《分布式KVM調(diào)度管理坐席系統(tǒng)功能要求和試驗方法》等14項行業(yè)標準和團體標準，為音視頻行業(yè)的健康、標準化發(fā)展奠定了堅實基礎。itc將以此為動力，繼續(xù)秉持“領先行業(yè)，造福人類”的企業(yè)使命，堅持科技創(chuàng)新、品質(zhì)至上的發(fā)展戰(zhàn)略，以新技術、新應用持續(xù)為廣大客戶提供更高效、智慧、安全的分布式綜合管理系統(tǒng)和整體解決方案，引領中國制邁向更高水平，為音視頻行業(yè)的發(fā)展注入更多新的動力，共同開啟數(shù)字化轉(zhuǎn)型與智能制造新篇章。

?音視頻行業(yè) ?分布式處理 ?KVM坐席協(xié)作
迅雷一鍵即可完成大模型下載

近日，迅雷為提升用戶使用體驗，讓用戶能夠更快更好地批量下載大模型所有文件，已針對大模型下載場景進行了優(yōu)化，并上線了新版本插件，下載迅雷客戶端且在瀏覽器安裝迅雷插件即可使用。值得一提的是，在使用迅雷該插件功能創(chuàng)建任務時，將同時創(chuàng)建相對應的文件夾，下載完成后，所有文件都將在一個文件夾中，相比傳統(tǒng)瀏覽器——需要用戶逐個手動點擊下載圖標并?

?迅雷 ?大模型下載 ?下載優(yōu)化
長虹將發(fā)布治愈系AI電視“追光熊貓”：可一鍵直達熊貓樂園

長虹電視發(fā)布預熱海報稱，將于4月18日發(fā)布一款治愈系AITV追光熊貓”。長虹電視將攜治愈系AITV”家族的新成員正式亮相臥龍大熊貓棲息地。其采用DRCBS雙側(cè)漫反射環(huán)境光補償技術，減少強光刺激、緩沖明暗對比，均勻補償環(huán)境光、渲染氛圍，打造舒適護眼光環(huán)境。

?長虹電視 ?治愈系AI ?TV
一鍵打擊黑公關和水軍！蔚來上線“一鍵上報”功能：最高獎100萬

今日晚間，蔚來法務部發(fā)文稱，為打擊黑公關和水軍，蔚來法務部上線一鍵上報”功能。蔚來法務部表示，近期在廣大用戶和朋友的支持下，蔚來打擊黑公關、水軍及其他侵權行為取得了一定進展，多個侵權賬號被封禁、行政處罰、判決侵權或已道歉賠償。蔚來將給予提供線索者答謝，且金額必定超過他們作為水軍所能獲得的收入。

?蔚來法務 ?打擊黑公關 ?水軍曝光
扣子也可以一鍵轉(zhuǎn)化為 MCP Server 了

受 Dify 啟發(fā)，我在扣子上開發(fā)了一個應用，可以一鍵把扣子的工作流轉(zhuǎn)化為 MCP Server。你不需要知道什么是 MCP Server也不需要知道怎么寫 MCP Server只需要按下面的要求填個表單，按提示復制、粘貼、再復制、再粘貼，就好了。給你要轉(zhuǎn)化為的 MCP 服務起個名、描述一下它的功能和輸入輸出參數(shù)，就可以得到一段 Python 代碼，復制存到你電腦上，按應用下面的配置說明，復制粘貼到?

?MCP ?Server ?應用開發(fā)
真·人人自媒體！手機端微信重磅升級：個人公眾號一鍵注冊、發(fā)布內(nèi)容

快科技4月17日消息，微信公眾號是一個覆蓋面非常廣泛的公眾平臺，是自媒體時代的主流平臺之一。不過，以往公眾號都要在網(wǎng)頁端操作，對于很多人，尤其是個人創(chuàng)作者非常不便。今天微信官方宣布重磅升級，手機端微信支持個人公眾號一鍵注冊和發(fā)布內(nèi)容了。已擁有個人公眾號的，進入「微信-公眾號-右上角（個人中心）」，管理員能直接用手機撰寫發(fā)布公眾號圖文/文章，回復留言私信，內(nèi)容創(chuàng)作更即興。還未有個人公眾號的，點擊「發(fā)表」按鈕，填寫信息就能快速注冊，秒get創(chuàng)作者身份。這讓當年人人都是自媒體”的成真了，每個人都能便捷的發(fā)布內(nèi)?

?微信公眾號 ?自媒體 ?內(nèi)容創(chuàng)作
何小鵬“劇透”：小鵬訓練的一個物理大模型是國內(nèi)車企“獨一份”

快科技4月14日消息，今日早間，小鵬汽車創(chuàng)始人何小鵬在社交平臺發(fā)帖稱：作為最早把「智能化」作為核心的車企，小鵬的本質(zhì)是「AI汽車公司」，我認為AI 最大的價值在于改變物理世界，而不僅是數(shù)字世界，我們要做一家面向全球的AI汽車公司，我更想通過 AI 來改變物理世界，這是很有意義的，但難度也更大。小鵬堅持全棧自研，去年率先在自動駕駛領域引入強化學習、模型

?小鵬汽車 ?AI汽車 ?智能化
薦剛剛，OpenAI發(fā)布GPT-image-1模型，更強吉卜力版本來啦

OpenAI發(fā)布全新圖像生成模型GPT-image-1，通過API向全球開發(fā)者開放。該模型支持精細控制圖像敏感度、生成效率、背景、輸出格式等參數(shù)，并集成吉卜力模式。Adobe、Figma等企業(yè)已將其應用于產(chǎn)品中。API支持批量生成、蒙版編輯、透明度調(diào)整等高級功能，圖像生成成本從0.02-0.19美元/張不等。CEO Sam Altman表示該模型與ChatGPT版本差異顯著，開發(fā)者可通過API實現(xiàn)更多創(chuàng)意場景。新模型在?

?OpenAI ?GPT-image-1 ?圖像生成
苦等一年 Meta終于放大招正式發(fā)布開源大模型Llama 4

美國科技巨擘Meta重磅推出其迄今最為強大的開源AI模型Llama4，恰逢Llama3上市一周年之際。Llama4系列采用了先進的混合專家架構，這一架構在模型訓練及用戶查詢回答過程中展現(xiàn)出更高效率，通過將模型劃分為多個專注于特定任務的專家”子模型，實現(xiàn)精準高效的處理。Meta首席執(zhí)行官扎克伯格表示：他們的目標是建立世界領先的人工智能，將其開源，并使其普遍可用，以便世界上每個人都能受益。

?Meta ?Llama ?4

熱文

3 天
7天

中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

清華發(fā)布SmartMoE：支持用戶一鍵實現(xiàn) MoE 模型分布式訓練

薦剛剛，商湯發(fā)布第六代大模型：6000億參數(shù)多模態(tài)MoE，中長視頻直接可推理

年度評選！itc保倫股份榮獲“分布式處理十大品牌”殊榮

迅雷一鍵即可完成大模型下載

長虹將發(fā)布治愈系AI電視“追光熊貓”：可一鍵直達熊貓樂園

一鍵打擊黑公關和水軍！蔚來上線“一鍵上報”功能：最高獎100萬

扣子也可以一鍵轉(zhuǎn)化為 MCP Server 了

真·人人自媒體！手機端微信重磅升級：個人公眾號一鍵注冊、發(fā)布內(nèi)容

何小鵬“劇透”：小鵬訓練的一個物理大模型是國內(nèi)車企“獨一份”

薦剛剛，OpenAI發(fā)布GPT-image-1模型，更強吉卜力版本來啦

苦等一年 Meta終于放大招正式發(fā)布開源大模型Llama 4

熱文

站長商機