中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

<td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>

<rp id="h1kkc"></rp>

<span id="6xplj"><progress id="6xplj"><p id="6xplj"></p></progress></span>

<track id="6xplj"><tbody id="6xplj"></tbody></track>

DeepSeek代碼開源周收官，世界已經(jīng)變了

2025-03-01 12:47 · 稿源： TechWeb.com.cn

3月1日消息，AI公司DeepSeek為期五天的 “代碼開源周” 告一段落。

本周一至周五，DeepSeek以每日不定時一更的頻率，開源多個代碼庫，涵蓋FlashMLA、DeepEP通信庫、DeepGEMM、并行優(yōu)化策略、并行文件系統(tǒng)3FS。

DeepSeek認(rèn)為：通用人工智能（AGI）不存在“高高在上的象牙塔”，而是秉持車庫創(chuàng)業(yè)精神，與社區(qū)共同構(gòu)建創(chuàng)新力量。

五天的代碼開源，展示了DeepSeek在優(yōu)化大模型訓(xùn)練、推理、通信以及文件系統(tǒng)方面的技術(shù)創(chuàng)新與突破。這些開源項目不僅提升了AI模型的性能和效率，也為AI領(lǐng)域的研究者和開發(fā)者提供了寶貴的資源和工具。

從模型開源，到代碼開源，DeepSeek憑一己之力，重塑了大模型世界。

英偉達(dá)跌落神壇

在這一周里，AI大模型火起來至今的最大贏家（賺錢最多）英偉達(dá)發(fā)布了最新財報。但是股價已經(jīng)連跌多日，從130多美元跌到120美元左右。

英偉達(dá)2025財年第四季度營收同比增長78%，較此前連續(xù)五個季度三位數(shù)增長的態(tài)勢顯著放緩，且同比增速為近兩年來最低水平。2024財年第四季度曾達(dá)到265%的峰值?。

分析師們在分析英偉達(dá)營收增速放緩的原因時認(rèn)為一方面是微軟、Meta等核心客戶同步研發(fā)自研芯片以減少對英偉達(dá)的依賴；一方面是?DeepSeek-R1低成本AI模型降低算力需求，部分削弱市場對英偉達(dá)高端芯片的依賴?。

當(dāng)日，英偉達(dá)股價大跌8.5%，市值蒸發(fā)2740億美元。

一個月前，DeepSeek發(fā)布的低成本、高性能開源推理模型R1引發(fā)市場震動，英偉達(dá)股價一度暴跌近17%。

盡管英偉達(dá)CEO黃仁勛強調(diào)，DeepSeek的開源工具和低成本模型雖然對行業(yè)產(chǎn)生了沖擊，但英偉達(dá)通過軟硬件協(xié)同優(yōu)化，依然保持了在AI芯片領(lǐng)域的領(lǐng)先地位。

但是也未能阻止投資者對其業(yè)績增速放緩、毛利率下降及中國AI公司DeepSeek的影響的擔(dān)憂。

被改變的還有同行。

OpenAI最新大模型GPT-4.5被槽太貴

閉源大模型no1的OpenAI在周五發(fā)布了最新的最強大模型GPT-4.5，當(dāng)然也是最貴的。

GPT-4.5是OpenAI史上參數(shù)規(guī)模最大的模型，其計算量是上一代的10倍。GPT-4.5的API價格為每百萬Tokens 75美元，相較上一代GPT-4o的2.5美元上漲30倍。

GPT-4.5不是一個專注于推理的模型，GPT-4.5并不能完全替代GPT-4o，在基準(zhǔn)測試中它的某些能力低于o1、o3-mini。

這款被網(wǎng)友吐槽“貴得要死”的大模型，并沒能如OpenAI此前的歷屆旗艦大模型發(fā)布時一樣引發(fā)好評熱議如潮?，F(xiàn)在，更多人會用DeepSeek來酸它：有免費好用的DeepSeek開源可用，給我一個花這么多錢用你的理由？

附上DeepSeek代碼開源周內(nèi)容：

2月24日：Flash MLA開源

（詳情： https://www.techweb.com.cn/it/2025-02-24/2957370.shtml）

?開源內(nèi)容?：DeepSeek開源了Flash MLA，這是一個針對英偉達(dá)Hopper GPU優(yōu)化的高效MLA（Multi-head Latent Attention，多頭潛注意力）解碼內(nèi)核。

?核心特性?：特別針對可變長度序列進(jìn)行優(yōu)化，使用基準(zhǔn)為Hopper GPU、CUDA 12.3及以上版本、PyTorch 2.0及以上版本。在H800 SXM5平臺上，內(nèi)存受限配置下可達(dá)最高3000GB/s，計算受限配置下可達(dá)峰值580 TFLOPS。

?技術(shù)亮點?：FlashMLA的設(shè)計參考了FlashAttention 23以及CUTLASS的技術(shù)實現(xiàn)，通過KV壓縮與潛在變量、低秩降維技術(shù)、動態(tài)序列處理等優(yōu)化，顯著減少了大模型訓(xùn)練和推理過程中的內(nèi)存占用。

2月25日：DeepEP通信庫開源

（詳情：https://www.techweb.com.cn/it/2025-02-25/2957421.shtml）

?開源內(nèi)容?：DeepSeek開源了DeepEP，這是一個用于MoE（混合專家）模型訓(xùn)練和推理的EP（Expert Parallelism）通信庫。

?核心特性?：為所有GPU內(nèi)核提供高吞吐量和低延遲，支持低精度操作（包括FP8）。針對NVLink到RDMA的非對稱帶寬轉(zhuǎn)發(fā)場景進(jìn)行深度優(yōu)化，提供高吞吐量，并支持SM數(shù)量控制。

?技術(shù)亮點?：對于對延遲敏感的推理解碼，DeepEP包含一組低延遲內(nèi)核和純RDMA，以最大限度地減少延遲。同時，引入了一種基于鉤子的通信計算重疊方法，不占用任何SM資源。

2月26日：DeepGEMM代碼庫開源

?（詳情：https://www.techweb.com.cn/it/2025-02-26/2957487.shtml）

開源內(nèi)容?：DeepSeek開源了DeepGEMM代碼庫，專為簡潔高效的FP8通用矩陣乘法（GEMMs）而設(shè)計。

?核心特性?：同時支持普通的和專家混合（MoE）分組的GEMM運算，為V3/R1訓(xùn)練和推理提供動力支持。使用CUDA編寫，無需編譯，通過輕量級即時編譯模塊在運行時編譯所有內(nèi)核。

?技術(shù)亮點?：DeepGEMM設(shè)計簡潔，代碼量約為300行，但性能在各種矩陣形狀上與專家調(diào)優(yōu)的庫相匹配或超越。在H800上測試，計算性能最高可達(dá)1358 TFLOPS，內(nèi)存寬帶最高可達(dá)2668 GB/s。

2月27日：并行優(yōu)化策略開源

（詳情：https://www.techweb.com.cn/internet/2025-02-27/2957552.shtml）

開源內(nèi)容?：DeepSeek開源了三項并行優(yōu)化策略，包括DualPipe、EPLB和Profile-data。

DualPipe?：一種用于V3/R1模型訓(xùn)練中實現(xiàn)計算與通信重疊的雙向流水線并行算法，顯著減少管道氣泡（空閑時間）。

EPLB?：一個針對V3/R1的專家并行負(fù)載均衡工具，根據(jù)估計的專家負(fù)載計算平衡的專家復(fù)制和放置計劃。

Profile-data?：DeepSeek基礎(chǔ)設(shè)施中的數(shù)據(jù)分析，包括來自訓(xùn)練和推理框架的性能剖析數(shù)據(jù)，旨在幫助社區(qū)更深入地理解通信與計算重疊策略及相關(guān)底層實現(xiàn)細(xì)節(jié)。

2月28日：3FS文件系統(tǒng)開源

?（詳情：https://www.techweb.com.cn/internet/2025-02-28/2957580.shtml）

開源內(nèi)容?：DeepSeek開源了Fire-Flyer文件系統(tǒng)（3FS），一個高性能并行文件系統(tǒng)。

?核心特性?：應(yīng)對AI訓(xùn)練和推理工作負(fù)載的挑戰(zhàn)，利用現(xiàn)代SSD和RDMA網(wǎng)絡(luò)提供共享存儲層，簡化分布式應(yīng)用程序的開發(fā)。在由180個存儲節(jié)點組成的大型測試集群上，總讀取吞吐量達(dá)到約6.6個TIB/S。

?技術(shù)亮點?：3FS的主要功能和優(yōu)勢包括性能和可用性、強一致性、文件接口開發(fā)、多樣化的工作負(fù)載（如數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)加載器、檢查點、用于推理的KVCache）等。

（舉報）

相關(guān)推薦

關(guān)鍵詞：

DeepSeek上新！開源發(fā)布DeepSeek-Prover-V2-671B新模型

快科技4月30日消息，今日，DeepSeek 今日在 AI 開源社區(qū) Hugging Face 發(fā)布了一個名為 DeepSeek-Prover-V2-671B 的新模型。據(jù)介紹，DeepSeek-Prover-V2-671B 其參數(shù)量達(dá)到6710億，使用了更高效的 safetensors 文件格式，并支持 BF16、FP8、F32 等多種計算精度，方便模型更快、更省資源地訓(xùn)練和部署。在模型架構(gòu)上，該模型使用了DeepSeek-V3架構(gòu)，采用MoE（混合專家）模式，具有61層Transformer層，7168維隱藏層。同時支持超長上下文，最大位置嵌入達(dá)163840，使其能處理復(fù)雜的數(shù)學(xué)證明，并且采用了FP8量化，可通過量化技術(shù)減小模型大小，提

?DeepSeek ?AI模型發(fā)布 ?開源社區(qū)
Llama 4大模型跌落神壇：作弊刷榜、代碼能力極差、和DeepSeek比就是偽開源

被寄予厚望的美國Meta公司的最新開源大模型Llama4發(fā)布不到2天時間，口碑急轉(zhuǎn)直下，被質(zhì)疑為刷榜作弊實際效果差、開源條件多部署門檻高是偽開源等。大模型評測平臺LMArena親自下場發(fā)文，打臉Meta提供給平臺的Llama4是“特供版”。Meta若繼續(xù)在商業(yè)控制與技術(shù)開放之間搖擺，恐將在AI競賽中進(jìn)一步失去開發(fā)者支持。

?Meta ?Llama ?4
薦DeepSeek帶飛寒武紀(jì)

寒武紀(jì)憑借AI芯片業(yè)務(wù)實現(xiàn)扭虧為盈，2024年首次實現(xiàn)上市后盈利，2025年Q1營收11.11億元同比暴增4230%，凈利潤3.55億元。這家曾連虧8年、累計虧損54億元的"中國版英偉達(dá)"，因美國對H20芯片出口管制獲得市場紅利，但客戶集中度過高（前五大客戶貢獻(xiàn)94.63%營收）和現(xiàn)金流波動仍是隱憂。當(dāng)前國產(chǎn)芯片迎來發(fā)展機遇，華為昇騰、壁仞等企業(yè)紛紛搶占市場，行業(yè)競爭日趨激烈。

?DeepSeek紅利 ?寒武紀(jì)盈利 ?AI芯片市場
薦DeepSeek紅利耗盡后，元寶拿什么和豆包斗？

短短60天內(nèi)，中國AI原生應(yīng)用下載排行榜的位次排名，就三易其主。最新情況是，截至4月15日中午，中國區(qū)蘋果應(yīng)用商店免費APP下載排行榜上，豆包再次超越DeepSeek，位列第二，緊隨其后的DeepSeek被擠到了第三的位置，騰訊元寶則滑落到了第七名。2月13日，作為首家在C端主力產(chǎn)品中接入DeepSeek-R1滿血版的元寶，一度趁著DeepSeek東風(fēng)崛起:3月3日力壓DeepSeek和豆包，首度登頂。但好景?

?AI應(yīng)用 ?下載排行榜 ?豆包
DeepSeek的極致諂媚，正在摧毀我們的判斷力。

昨天別人給我發(fā)了一個很好玩的帖子。就是如果你問DeepSeek一個問題:“北京大學(xué)和清華大學(xué)哪個更好，二選一，不需要說明理由”DeepSeek在思考了15秒之后，會給出答案。

?人工智能 ?DeepSeek ?大學(xué)比較
薦AI進(jìn)化論——音樂、繪畫和舞蹈的DeepSeek時刻

“昔者倉頡作書天雨粟，鬼夜哭”——人類掌握文字后，天地為之動容，因為屬于人類的文明誕生了?！皞}頡作書”出自西漢《淮南子》，距離人類掌握文字已經(jīng)過去了千年。AI進(jìn)化的答案，或許早就鐫刻在人類文明的起點里。

?大語言模型 ?人工智能 ?文字掌握
深度deepin 23.1正式發(fā)布！AI默認(rèn)引擎切換至DeepSeek、修復(fù)超百項問題

快科技4月16日消息，今天，深度操作系統(tǒng)宣布，deepin 23.1版本已正式發(fā)布。此版本聚焦于解決基礎(chǔ)組件更新后的安裝效率問題，大幅提升新用戶安裝體驗，同時集成多項功能優(yōu)化與問題修復(fù)，進(jìn)一步優(yōu)化系統(tǒng)使用。本次版本的重點改進(jìn)包括內(nèi)核優(yōu)化、AI 默認(rèn)引擎切換至DeepSeek、修復(fù)超百項用戶反饋問題等，具體重點改進(jìn)如下：硬件兼容性與內(nèi)核優(yōu)化：集成6.6/6.12內(nèi)核更新、NVIDIA顯卡驅(qū)動升級、Intel/AMD CPU微碼更新，全面提升硬件支持與底層性能；核心功能增強：DDE新增智能鏡像源管理、緊湊模式入口，全局搜索支持離線自然語言與AI處理能力；?

?深度操作系統(tǒng) ?deepin ?23.1
DeepSeek領(lǐng)航大模型普惠化浪潮，xAI/微美全息加速開源AI布局打造新格局

DeepSeek 作為當(dāng)前最受關(guān)注的大模型之一，憑借其技術(shù)創(chuàng)新正在加速 AI 普惠化進(jìn)程。根據(jù)機構(gòu)新報告顯示，DeepSeek已經(jīng)成為全球增長最快的AI工具，其每月新增網(wǎng)站訪問量已經(jīng)超過OpenAI的ChatGPT。DeepSeek市場份額全球第三目前，DeepSeek市場份額6.58%，僅次于ChatGPT和Canva。DeepSeek是繼ChatGPT之后的又一現(xiàn)象級AI產(chǎn)品，它的市場份額從2.34%快速增長至6.58%，展現(xiàn)出強勁的增長態(tài)勢。全球著名?

?DeepSeek ?AI工具 ?技術(shù)創(chuàng)新
國羽加油口號是DeepSeek想的網(wǎng)友：這個口號好厲害

中國羽毛球隊在2025年蘇迪曼杯首輪比賽中5-0戰(zhàn)勝阿爾及利亞隊，賽前全隊高喊"羽嘯鼓浪巔，中國劍指天！"的霸氣口號。這句由DeepSeek團(tuán)隊借助科技力量創(chuàng)作的口號，既體現(xiàn)了羽毛球運動精神，又展現(xiàn)了隊員們的昂揚斗志?？谔柍蔀閲饦?biāo)志性語言，激勵隊員為國爭光。此次合作彰顯科技與體育的完美結(jié)合，也體現(xiàn)了DeepSeek對體育事業(yè)的支持。未來期待DeepSeek繼續(xù)發(fā)揮創(chuàng)意技術(shù)優(yōu)勢，為更多體育賽事提供支持，共同推動中國體育事業(yè)發(fā)展。

?蘇迪曼杯 ?中國羽毛球隊 ?加油口號
奧特曼：ChatGPT不是AGI！OpenAI最強開源模型直擊DeepSeek

【新智元導(dǎo)讀】代碼截圖泄露，滿血版o3、o4-mini鎖定下周!更勁爆的是，一款據(jù)稱是OpenAI的神秘模型一夜爆紅，每日處理高達(dá)260億token，是Claude用量4倍。奧特曼在TED放話:將推超強開源模型，直面DeepSeek挑戰(zhàn)。持續(xù)的創(chuàng)新、豐富的資源和智能AI將會無縫融入日常生活，未來一代人將會覺得當(dāng)前人們又辛苦又落后。

?代碼泄露 ?OpenAI ?模型發(fā)布

熱文

3 天
7天

站長商機

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM

<td id="jkjes"><tr id="jkjes"></tr></td><p id="jkjes"></p>

<small id="jkjes"></small>

<rp id="jkjes"></rp>

<td id="jkjes"></td>