中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

    <td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>
    <rp id="h1kkc"></rp>
    首頁 > 傳媒 > 關(guān)鍵詞  > 中國聯(lián)通最新資訊  > 正文

    大規(guī)模專家并行推理集群實現(xiàn)性能3倍躍遷,聯(lián)通元景開啟推理新紀(jì)元

    2025-04-07 19:36 · 稿源: 站長之家用戶

    近日,中國聯(lián)通持續(xù)技術(shù)攻堅,依托元景大模型MaaS平臺成功搭建“大規(guī)模專家并行” 推理集群,實現(xiàn)DeepSeek MoE 大模型在多節(jié)點間的超有效集群推理,單卡吞吐提升 3 倍,解碼時延降低 50%。這一成果不僅為人工智能技術(shù)的創(chuàng)新發(fā)展提供了強大助力,也讓各行業(yè)以更有效率應(yīng)用 AI 技術(shù),加速推動千行百業(yè)的數(shù)字化轉(zhuǎn)型。

    伴隨大模型MoE結(jié)構(gòu)重大技術(shù)革新,以往少量“全能型”專家的模式逐漸被取代,大量“??菩汀毙<抑饾u成為主流。這一轉(zhuǎn)變,極大地提升了模型的針對性和精細(xì)化程度,使得模型效果顯著改善。

    推理應(yīng)用在各行業(yè)的落地隨之全面加速,市場對于推理服務(wù)的需求呈井噴式增長,Tokens 處理量的需求與日俱增,這對推理系統(tǒng)的性能提出了更高的要求。為應(yīng)對這一挑戰(zhàn),大規(guī)模專家并行推理技術(shù)應(yīng)運而生,為大模型推理的加速規(guī)模應(yīng)用提供了強大的技術(shù)支撐。

    聯(lián)通元景大模型與昇騰深度合作,圍繞大規(guī)模專家并行推理技術(shù)展開全方位創(chuàng)新,將 DeepSeek 671B滿血版大模型的數(shù)百個“專科型” 小專家按特出方式分布到不同的NPU上,使得單卡權(quán)重占用顯存降低 75%,權(quán)重加載耗時大幅減少,可用于數(shù)據(jù)計算的顯存顯著增加。

    在通信環(huán)節(jié),雙方對集群跨機通信方案進(jìn)行深度優(yōu)化,通過引入先進(jìn)計算與通信并行算法,整體通信效率提升40%。此外,雙方聯(lián)合創(chuàng)新多級負(fù)載均衡算法,準(zhǔn)確識別并均衡各NPU 的負(fù)載,將卡間負(fù)載差異成功控制在 10% 以下,有效提升系統(tǒng)吞吐和計算資源利用率。

    聯(lián)通元景大模型MaaS平臺結(jié)合大規(guī)模專家并行推理集群系統(tǒng),基于DeepSeek 671B 滿血版大模型持續(xù)進(jìn)行針對性推理優(yōu)化創(chuàng)新,打造高可靠、高性能、易運維推理服務(wù)。

    圍繞高可靠

    依托實例內(nèi)和實例間的多級容災(zāi)機制,保障業(yè)務(wù)連續(xù)性,提供長穩(wěn)推理服務(wù)。圍繞高性能,進(jìn)行高并發(fā)請求調(diào)度、管理、轉(zhuǎn)發(fā)等,打造整個集群的有效數(shù)據(jù)請求管理入口。

    圍繞易運維

    進(jìn)行集群內(nèi)推理業(yè)務(wù)狀態(tài)監(jiān)控、以及PD身份和資源管理與決策等,打造整個推理集群的狀態(tài)監(jiān)控器和決策大腦,持續(xù)提升大規(guī)模專家并行推理集群易用性。

    在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的浪潮中,中國聯(lián)通始終勇立潮頭,全面發(fā)力人工智能。從精心搭建智算基礎(chǔ)設(shè)施,構(gòu)建強大算力“引擎”,到成功落地大規(guī)模專家并行推理集群,打造高性能低時延推理“中樞”,聯(lián)通元景大模型持續(xù)筑牢國產(chǎn)化智算底座,以技術(shù)需求雙輪驅(qū)動,打造“普惠速成”的元景MaaS平臺,讓人工智能更簡單,為 AI 產(chǎn)業(yè)發(fā)展注入強勁的“加速度”。

    這一推理創(chuàng)新舉措必將助力各行業(yè)在復(fù)雜多變、競爭激烈的市場環(huán)境中搶占先機,以智能化驅(qū)動數(shù)字化轉(zhuǎn)型,進(jìn)而推動實體經(jīng)濟(jì)高質(zhì)量發(fā)展。

    推廣

    特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))均為站長傳媒平臺用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù),對本頁面內(nèi)容所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任,相關(guān)信息僅供參考。站長之家將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。任何單位或個人認(rèn)為本頁面內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,可及時向站長之家提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明(點擊查看反饋聯(lián)系地址)。本網(wǎng)站在收到上述法律文件后,將會依法依規(guī)核實信息,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

    • 相關(guān)推薦
    • LIFETOO品牌麥角硫因:開啟抗衰養(yǎng)顏新紀(jì)元

      LIFETOO是一個專注于抗衰老營養(yǎng)健康的品牌,由多位生物學(xué)博士創(chuàng)立,依托美日先進(jìn)營養(yǎng)科學(xué)技術(shù)研發(fā)產(chǎn)品。其明星產(chǎn)品麥角硫因膠囊具有強效抗氧化功效,能改善皮膚狀態(tài)、增強彈性。品牌擁有專業(yè)研發(fā)團(tuán)隊和自有生產(chǎn)線,產(chǎn)品通過嚴(yán)格質(zhì)量控制,在全球多個國家銷售并獲得消費者認(rèn)可。LIFETOO堅持"探索營養(yǎng)與健康的未來"理念,致力于為消費者提供高品質(zhì)、個性化的營養(yǎng)呵護(hù)方案。

    • 行業(yè)先行者,艾娑姟雅(EXOGAIA)開啟抗衰護(hù)膚新紀(jì)元

      艾嬈嬋雅(EXOGAIA)在美博會上展示前沿細(xì)胞科研成果,推出"雙外泌體"護(hù)膚理念。品牌采用TFF外泌體提取技術(shù),從羊胎盤和蓮葉中提取高活性物質(zhì),通過膜融合機制促進(jìn)膠原再生。其產(chǎn)品線涵蓋抗衰修護(hù)全系列,包括微囊精華液、人參精華油等明星單品。依托廣東慈惠生物科技強大的科研團(tuán)隊,品牌專注于肌衰老機理研究,已獲得國際INCI認(rèn)證。艾嬈嬋雅通過創(chuàng)新技術(shù)重新?

    • 英氏攜手中國營養(yǎng)學(xué)會開啟科學(xué)喂養(yǎng)新紀(jì)元

      4月18日,中國營養(yǎng)學(xué)會與英氏控股集團(tuán)在瀏陽經(jīng)開區(qū)共同舉辦"嬰幼兒輔食科學(xué)5階喂養(yǎng)標(biāo)準(zhǔn)體系化建設(shè)暨深度科研啟動儀式"?;顒泳劢箣胗變狠o食行業(yè)標(biāo)準(zhǔn)化發(fā)展,推出"科學(xué)5階精準(zhǔn)喂養(yǎng)體系",針對不同發(fā)育階段嬰幼兒營養(yǎng)需求進(jìn)行精準(zhǔn)劃分。英氏與江南大學(xué)、湖南省農(nóng)科院簽署戰(zhàn)略協(xié)議,共建"嬰童未來食品實驗室"和"嬰幼兒輔食與營養(yǎng)產(chǎn)業(yè)發(fā)展研究院",推動產(chǎn)學(xué)研深度融合。英氏投資建設(shè)的嬰幼兒營養(yǎng)與健康科學(xué)產(chǎn)業(yè)基地一期已在瀏陽建成投產(chǎn),致力于全生命周期營養(yǎng)產(chǎn)品研發(fā)。專家指出,科學(xué)喂養(yǎng)直接影響嬰幼兒成長發(fā)育,行業(yè)標(biāo)準(zhǔn)實施將規(guī)范市場秩序,提升國民嬰幼兒營養(yǎng)健康水平。

    • Funcom宣布《沙丘:覺醒》大規(guī)模測試即將開啟

      《沙丘:覺醒》將于6月10日正式上線,5月10日將在倫敦與PAX East同步舉行全球在線派對直播,并發(fā)放數(shù)萬測試密鑰。5月9日至12日將開啟大規(guī)模測試,玩家可體驗前20小時內(nèi)容及第一章劇情。游戲基于弗蘭克·赫伯特經(jīng)典科幻小說改編,融合電影化敘事與開放世界生存玩法,玩家將探索厄拉科斯沙漠星球,揭開神秘預(yù)言與古老陰謀交織的故事。購買豪華版或終極版可提前5天進(jìn)入游戲。開發(fā)商Funcom曾推出《流放者柯南》等知名作品。

    • 妙音數(shù)科領(lǐng)航 VR 創(chuàng)新 ,《一念幻世》開啟沉浸式科技新紀(jì)元

      北京妙音數(shù)科推出國內(nèi)首個"AI覺醒與人類文明存續(xù)"主題VR大空間沉浸項目《一念幻世》。該項目融合AI與VR技術(shù),采用厘米級精準(zhǔn)追蹤系統(tǒng),支持玩家在數(shù)百平米真實場地自由探索虛擬場景。創(chuàng)新性地結(jié)合AI智能實時語音對話與手勢識別技術(shù),實現(xiàn)"所見即所感"的沉浸體驗。項目以AI覺醒危機為主線,通過交互式解謎引導(dǎo)玩家思考科技倫理問題。首發(fā)落地河北邯鄲?

    • 不要思考過程,推理模型能力能夠更強

      UC伯克利和艾倫實驗室的最新研究表明,推理模型無需依賴冗長的思考過程也能有效工作。研究人員提出的"無思考(NoThinking)"方法通過簡單提示直接生成解決方案,跳過了傳統(tǒng)推理模型中的顯性思考步驟。實驗證明,在低資源(低token數(shù)量、少模型參數(shù))或低延遲情況下,NoThinking方法的表現(xiàn)優(yōu)于傳統(tǒng)思考方式,能減少token使用量并提高推理速度。該方法在數(shù)學(xué)問題解決、編程和形式定理證明等任務(wù)中表現(xiàn)優(yōu)異,尤其在資源受限時優(yōu)勢更明顯。研究還發(fā)現(xiàn),結(jié)合并行計算擴展后,NoThinking能進(jìn)一步提升性能,在保持準(zhǔn)確性的同時顯著降低延遲和計算成本。這一發(fā)現(xiàn)挑戰(zhàn)了"推理模型必須依賴詳細(xì)思考過程"的傳統(tǒng)認(rèn)知。

    • 國產(chǎn)六大推理模型激戰(zhàn)OpenAI?

      2025年春節(jié)前夕,DeepSeek-R1模型發(fā)布,標(biāo)志著中國AI進(jìn)入推理模型新時代。文章梳理了國產(chǎn)大模型發(fā)展歷程:從2022年ChatGPT引發(fā)國內(nèi)追趕OpenAI熱潮,到2023年"百模大戰(zhàn)",再到2024年"AI六小虎"格局形成。重點分析了六大國產(chǎn)推理模型(DeepSeek、百度、阿里、科大訊飛、字節(jié)、騰訊)的技術(shù)特點與市場表現(xiàn),指出國產(chǎn)模型在性能上已接近GPT-4水平。特別強調(diào)科大訊飛星火X1憑借全國產(chǎn)化技術(shù)路線獲得政企青睞,以及DeepSeek-R1以560萬美元超低成本實現(xiàn)高性能的突破。文章還探討了英偉達(dá)芯片斷供危機下,國產(chǎn)全棧技術(shù)路徑的重要性,認(rèn)為自主可控將成為對抗國際不確定性的關(guān)鍵。最后指出,隨著推理模型成為競爭焦點,國產(chǎn)大模型正從技術(shù)追隨轉(zhuǎn)向自主創(chuàng)新階段。

    • 超聚變探索者大會2025:算力煥新,開啟智能新紀(jì)元

      4 月 15 日- 17 日,以“共建智能體時代”為主題的超聚變探索者大會 2025 在鄭州成功舉行。大會匯聚 2500 余名行業(yè)領(lǐng)袖、專家、媒體等伙伴及客戶,提出并深入探討智能體時代的發(fā)展趨勢、驅(qū)動要素與價值應(yīng)用,重磅發(fā)布超聚變算力業(yè)務(wù)、城企數(shù)智業(yè)務(wù)、智慧能源解決方案三大業(yè)務(wù)領(lǐng)域的全新產(chǎn)品矩陣,共同聚焦技術(shù)創(chuàng)新的廣闊應(yīng)用,與全球生態(tài)伙伴積極擁抱戰(zhàn)略機遇,攜手共

    • 新增自主決策推理模型!理想汽車OTA 7.2開啟推送

      快科技4月3日消息,我們從理想汽車官方獲悉,OTA7.2版本車機系統(tǒng)正式開啟推送,預(yù)計一周內(nèi)完成,升級耗時約50分鐘。本次更新新增自主決策推理模型,該模型基于車載場景數(shù)據(jù)及通用推理模型數(shù)據(jù)打造,可根據(jù)問題內(nèi)容自主決策是否深度思考,面對車控指令等簡單問題時,能夠保障響應(yīng)速度。智能座艙方面,新增全能兒童鎖功能,支持一鍵鎖定副駕老板鍵、后排座椅物理按?

    • 猿輔導(dǎo)開啟“教育+AI”新紀(jì)元,小猿AI三大產(chǎn)品重塑學(xué)習(xí)全場景體驗

      4月15日,猿輔導(dǎo)集團(tuán)發(fā)布教育行業(yè)首個AI范式"小猿AI",推出覆蓋家校場景的三大戰(zhàn)略級產(chǎn)品。該AI系統(tǒng)基于十年教育數(shù)據(jù)沉淀,構(gòu)建四層技術(shù)架構(gòu):動態(tài)學(xué)情數(shù)據(jù)庫、自研大模型矩陣和個性化學(xué)習(xí)方案。核心產(chǎn)品包括:1)小猿AI App,首創(chuàng)"五重錯因分析系統(tǒng)",學(xué)習(xí)效率提升40%;2)小猿AI學(xué)習(xí)機,搭載13英寸護(hù)眼屏和智能基座;3)飛象人工智能通識課,國內(nèi)首套K12全學(xué)段AI課程。創(chuàng)新亮點包括知識導(dǎo)航系統(tǒng)精準(zhǔn)度達(dá)91%、情感計算引擎識別8類情緒狀態(tài)。集團(tuán)宣布實施普惠計劃,基礎(chǔ)功能向全國中小學(xué)生免費開放。此次發(fā)布標(biāo)志著我國教育智能化進(jìn)入新階段,通過"技術(shù)+內(nèi)容+終端"立體化布局,重新定義因材施教內(nèi)涵。