云天勵飛DeepEdge10適配DeepSeek開源周“首個大招”：FlashMLA

2025-02-27 10:46 · 稿源：站長之家用戶

2 月 24 日，DeepSeek"開源周"正式啟動，并發(fā)布頭個代碼庫FlashMLA，引發(fā)全球關注。

FlashMLA是針對英偉達Hopper GPU優(yōu)化的有效MLA解碼內核，專為可變長度序列優(yōu)化設計，是DeepSeek有效使用算力的核心程序模塊。FlashMLA通過MLA解碼優(yōu)化與分頁KV緩存技術，顯著提升硬件利用率，加速大語言模型解碼過程，有效提高響應速度與吞吐量，適用于各種實時對話生成場景。

云天勵飛芯片團隊在FlashMLA開源后，迅速完成了DeepEdge10 平臺與FlashMLA的適配工作。在適配過程中，云天勵飛采用了Op fusion tiling、Online softmax、Double buffer、細粒度存算并行等先進技術，并基于自研的Triton-like編程語言快速開發(fā)驗證了有效的FlashMLA算子。通過一系列優(yōu)化，不僅顯著提升了計算效率，還大幅降低了顯存占用，充分展現了DeepEdge10 平臺“算力積木”芯片架構的卓越優(yōu)勢，以及其與DeepSeek生態(tài)的高度契合性。

今日，云天勵飛已將相關代碼提交至開源平臺Gitee，為開源AI貢獻了重要的技術力量。

算子的源碼地址為:

https://gitee.com/Intellifusion_2025/tyllm/blob/master/python/tylang/flash_mla.py

DeepEdge10 系列芯片是專門針對大模型時代打造的芯片，支持包括 Transformer 模型、BEV 模型、CV 大模型、LLM 大模型等各類不同架構的主流模型;基于自主可控的先進國產工藝打造，采用獨特的“算力積木”架構，可靈活滿足智慧城市、智慧交通、智能制造、智慧倉儲、機器人、邊緣智算中心等不同場景對算力的需求，為大模型推理提供強大動力。

目前，DeepEdge10 芯片平臺已成功適配DeepSeek R1 系列模型及國產鴻蒙操作系統(tǒng)。未來，云天勵飛將持續(xù)加大研發(fā)力度，推動芯片在國產化領域取得更大突破，為國產AI生態(tài)建設貢獻更多力量。

（推廣）

特別聲明：以上內容(如有圖片或視頻亦包括在內)均為站長傳媒平臺用戶上傳并發(fā)布，本平臺僅提供信息存儲服務，對本頁面內容所引致的錯誤、不確或遺漏，概不負任何法律責任，相關信息僅供參考。站長之家將盡力確保所提供信息的準確性及可靠性，但不保證有關資料的準確性及可靠性，讀者在使用前請進一步核實，并對任何自主決定的行為負責。任何單位或個人認為本頁面內容可能涉嫌侵犯其知識產權或存在不實內容時，可及時向站長之家提出書面權利通知或不實情況說明，并提供身份證明、權屬證明及詳細侵權或不實情況證明（點擊查看反饋聯系地址）。本網站在收到上述法律文件后，將會依法依規(guī)核實信息，溝通刪除相關內容或斷開相關鏈接。

相關推薦

關鍵詞：

薦DeepSeek帶飛寒武紀

寒武紀憑借AI芯片業(yè)務實現扭虧為盈，2024年首次實現上市后盈利，2025年Q1營收11.11億元同比暴增4230%，凈利潤3.55億元。這家曾連虧8年、累計虧損54億元的"中國版英偉達"，因美國對H20芯片出口管制獲得市場紅利，但客戶集中度過高（前五大客戶貢獻94.63%營收）和現金流波動仍是隱憂。當前國產芯片迎來發(fā)展機遇，華為昇騰、壁仞等企業(yè)紛紛搶占市場，行業(yè)競爭日趨激烈。

?DeepSeek紅利 ?寒武紀盈利 ?AI芯片市場
DeepSeek上新！開源發(fā)布DeepSeek-Prover-V2-671B新模型

快科技4月30日消息，今日，DeepSeek 今日在 AI 開源社區(qū) Hugging Face 發(fā)布了一個名為 DeepSeek-Prover-V2-671B 的新模型。據介紹，DeepSeek-Prover-V2-671B 其參數量達到6710億，使用了更高效的 safetensors 文件格式，并支持 BF16、FP8、F32 等多種計算精度，方便模型更快、更省資源地訓練和部署。在模型架構上，該模型使用了DeepSeek-V3架構，采用MoE（混合專家）模式，具有61層Transformer層，7168維隱藏層。同時支持超長上下文，最大位置嵌入達163840，使其能處理復雜的數學證明，并且采用了FP8量化，可通過量化技術減小模型大小，提

?DeepSeek ?AI模型發(fā)布 ?開源社區(qū)
薦DeepSeek紅利耗盡后，元寶拿什么和豆包斗？

短短60天內，中國AI原生應用下載排行榜的位次排名，就三易其主。最新情況是，截至4月15日中午，中國區(qū)蘋果應用商店免費APP下載排行榜上，豆包再次超越DeepSeek，位列第二，緊隨其后的DeepSeek被擠到了第三的位置，騰訊元寶則滑落到了第七名。2月13日，作為首家在C端主力產品中接入DeepSeek-R1滿血版的元寶，一度趁著DeepSeek東風崛起:3月3日力壓DeepSeek和豆包，首度登頂。但好景?

?AI應用 ?下載排行榜 ?豆包
DeepSeek的極致諂媚，正在摧毀我們的判斷力。

昨天別人給我發(fā)了一個很好玩的帖子。就是如果你問DeepSeek一個問題:“北京大學和清華大學哪個更好，二選一，不需要說明理由”DeepSeek在思考了15秒之后，會給出答案。

?人工智能 ?DeepSeek ?大學比較
超過ChatGPT、Deepseek？谷歌發(fā)布 Gemini 2.5 Flash AI 模型

新版AI模型縮短了響應時間，節(jié)約了運算成本；還推出了新的AI芯片“Ironwood”。谷歌發(fā)布了新的AI模型“Gemini2.5Flash”，據稱，這款AI模型的性能比OpenAI和DeepSeek的AI產品“更高效”。谷歌計劃在三星今年上半年推出的AI伴侶機器人Ballie上搭載生成式AI模型。

?AI模型 ?谷歌 ?Gemini
薦AI進化論——音樂、繪畫和舞蹈的DeepSeek時刻

“昔者倉頡作書天雨粟，鬼夜哭”——人類掌握文字后，天地為之動容，因為屬于人類的文明誕生了?！皞}頡作書”出自西漢《淮南子》，距離人類掌握文字已經過去了千年。AI進化的答案，或許早就鐫刻在人類文明的起點里。

?大語言模型 ?人工智能 ?文字掌握
深度deepin 23.1正式發(fā)布！AI默認引擎切換至DeepSeek、修復超百項問題

快科技4月16日消息，今天，深度操作系統(tǒng)宣布，deepin 23.1版本已正式發(fā)布。此版本聚焦于解決基礎組件更新后的安裝效率問題，大幅提升新用戶安裝體驗，同時集成多項功能優(yōu)化與問題修復，進一步優(yōu)化系統(tǒng)使用。本次版本的重點改進包括內核優(yōu)化、AI 默認引擎切換至DeepSeek、修復超百項用戶反饋問題等，具體重點改進如下：硬件兼容性與內核優(yōu)化：集成6.6/6.12內核更新、NVIDIA顯卡驅動升級、Intel/AMD CPU微碼更新，全面提升硬件支持與底層性能；核心功能增強：DDE新增智能鏡像源管理、緊湊模式入口，全局搜索支持離線自然語言與AI處理能力；?

?深度操作系統(tǒng) ?deepin ?23.1
Llama 4大模型跌落神壇：作弊刷榜、代碼能力極差、和DeepSeek比就是偽開源

被寄予厚望的美國Meta公司的最新開源大模型Llama4發(fā)布不到2天時間，口碑急轉直下，被質疑為刷榜作弊實際效果差、開源條件多部署門檻高是偽開源等。大模型評測平臺LMArena親自下場發(fā)文，打臉Meta提供給平臺的Llama4是“特供版”。Meta若繼續(xù)在商業(yè)控制與技術開放之間搖擺，恐將在AI競賽中進一步失去開發(fā)者支持。

?Meta ?Llama ?4
國羽加油口號是DeepSeek想的網友：這個口號好厲害

中國羽毛球隊在2025年蘇迪曼杯首輪比賽中5-0戰(zhàn)勝阿爾及利亞隊，賽前全隊高喊"羽嘯鼓浪巔，中國劍指天！"的霸氣口號。這句由DeepSeek團隊借助科技力量創(chuàng)作的口號，既體現了羽毛球運動精神，又展現了隊員們的昂揚斗志。口號成為國羽標志性語言，激勵隊員為國爭光。此次合作彰顯科技與體育的完美結合，也體現了DeepSeek對體育事業(yè)的支持。未來期待DeepSeek繼續(xù)發(fā)揮創(chuàng)意技術優(yōu)勢，為更多體育賽事提供支持，共同推動中國體育事業(yè)發(fā)展。

?蘇迪曼杯 ?中國羽毛球隊 ?加油口號
薦反擊DeepSeek失??！Llama 4效果不好，Meta承認有問題

今天凌晨1點半，Meta生成式AI領導者AhmadAl-Dahle在社交平臺發(fā)布了一篇長文，對前天剛開源的Llama4質疑進行了官方回應。Ahmad表示，Llama4一開發(fā)完就發(fā)布了，所以，不同服務中模型質量難免會有一些差異。由于關稅大戰(zhàn)的原因，Meta的股票遭遇重創(chuàng)，他們也需要一個利好消息來拉升股票，現在適得其反。

?Meta ?Llama4 ?生成式AI

熱文

3 天
7天

1

累了倦了就找 ChatGPT……AI正在淪為“情緒垃圾桶”！

中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

云天勵飛DeepEdge10適配DeepSeek開源周“首個大招”：FlashMLA

薦DeepSeek帶飛寒武紀

DeepSeek上新！開源發(fā)布DeepSeek-Prover-V2-671B新模型

薦DeepSeek紅利耗盡后，元寶拿什么和豆包斗？

DeepSeek的極致諂媚，正在摧毀我們的判斷力。

超過ChatGPT、Deepseek？谷歌發(fā)布 Gemini 2.5 Flash AI 模型

薦AI進化論——音樂、繪畫和舞蹈的DeepSeek時刻

深度deepin 23.1正式發(fā)布！AI默認引擎切換至DeepSeek、修復超百項問題

Llama 4大模型跌落神壇：作弊刷榜、代碼能力極差、和DeepSeek比就是偽開源

國羽加油口號是DeepSeek想的網友：這個口號好厲害

薦反擊DeepSeek失??！Llama 4效果不好，Meta承認有問題

熱文

累了倦了就找 ChatGPT……AI正在淪為“情緒垃圾桶”！

站長商機