中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

    <td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>
    <rp id="h1kkc"></rp>
    首頁 > 業(yè)界 > 關鍵詞  > 英特爾最新資訊  > 正文

    英特爾SPR處理器配備64GB HBM2e、Ponte Vecchio擁有408MB L2緩存

    2021-11-16 11:54 · 稿源: cnbeta

    在一年一度的超算大會上,高性能計算行業(yè)的許多參與者都在積極討論硬件、安裝、以及設計等方面的最新進展。期間,芯片巨頭英特爾也展示了自家的硬件,并披露了有關下一代 Aurora Exascale 超算的諸多細節(jié)。起初,Aurora 計劃采用英特爾的 10nm 至強(Xeon)融核(Phi)平臺,但隨著技術的飛速發(fā)展,后續(xù)該項目也經(jīng)歷了多次推倒重來。

    幾年前最終敲定的方案,為 Aurora 選用了英特爾 Sapphire Rapids 處理器,特點是配備 HBM2e 高帶寬緩存。以及 Ponte Vecchio 架構的 Xe-HPC GPU 加速器,可擴展數(shù)百 PetaFLOP 到 ExaFLOP 級別的算力。

    早些時候,英特爾新任 CEO 帕特·基辛格透露,Ponte Vecchio 加速器實現(xiàn)了性能的翻番,可讓建成后的 Aurora 成為一臺“2+ EF”級別的超級計算機。

    該公司預計將在 2022 年之前交付機器的其余部分,并于第一季度增加主流用戶的硬件生產(chǎn),以便在上半年有更廣泛的發(fā)布。

    處理器方面,Aurora 為每個單元都配備了兩塊 Sapphire Rapids CPU(簡稱 SPR)。其具有四個計算塊、DDR5、PCIe 5.0、CXL 1.1(而不是 CXL.mem),并大量借用 EMIB 技術來實現(xiàn)連接。

    至于自帶的高帶寬內(nèi)存(HBM),可知英特爾為該系列 SPR 處理器選用了 8-Hi 堆棧,以提供高達 64GB 的 HBM2e 內(nèi)存。(據(jù)說英特爾打算使用四個 16GB HBM2e 堆棧來組成 64GB 內(nèi)存)

    考慮到英特爾與美光之間的特殊關系,我們發(fā)現(xiàn) Micron HBM2e 的物理尺寸,正巧與 Intel 材料中給出的標示一致(而不是三星或 SK 海力士)。

    當前美光提供了兩種帶有硬件 ECC 的 16GB HBM2e 產(chǎn)品,一種為每引腳 2.8 Gbps(每堆棧 358 GB/s)、另一種為每引腳 3.2 Gbps(每堆棧 410 GB/s)。

    取決于英特爾使用的版本,其峰值總帶寬可介于 1.432 ~ 1.64 TB/s 之間。不過 SPR HBM 版本還會額外使用四個 Tile,并將每個 HBM 堆棧連接到一個小芯片。

    由圖可知,盡管 Intel 表示 SPR+HBM 版本與普通 SPR SKU 共享插槽,但明顯還是存在不兼容的地方。這也能是一個實例,即 Aurora 超算上使用了專門的調(diào)整設計。

    至于 Ponte Vecchio(Xe HPC 2-Tile / PVC),英特爾披露單個 Aurora 服務器里的每兩塊 SPR 處理器,將搭配六塊 PVC 加速器。

    每個加速器都將使用內(nèi)置的新 Xe-Link 全拓撲互連協(xié)議,盡管全連接模式下支持 8 路,但 Aurora 還是相對節(jié)制了一下。

    盡管英特爾尚未披露 PVC 是如何與 SPR 處理器連接的,但至少 CPU / GPU 之間采用了統(tǒng)一內(nèi)存架構設計。

    英特爾補充道,每個 Ponte Vecchio 雙棧部署將具有總共 64 MB 的 L1 緩存和 408 MB 的 L2 緩存(每個堆棧具有 204 MB L2),并由 HBM2e 提供支持。

    作為比較,英偉達 A100 方案具有 40MB L2 緩存、AMD Navi 21 配備了 128MB 無限緩存(Infinity Cache / 有效 L3)。

    至于 AMD 為 Frontier 超算提供的 CDNA2 MI250X 加速卡,則配備了每堆棧 8MB L2 緩存(總共 16MB)。

    (圖 via AnandTech)

    無論采用何種方式進行切片,英特爾都在努力為 PVC 提供正確的緩存層次結構。由圖表的 4 個 HBM2e 芯片設計來看,每個 PVC 雙堆?;蚓哂懈哌_ 128GB 的 HBM2e 內(nèi)存。

    更重要的是,我們還正式獲悉 Aurora 將用到多少塊 Ponte Vecchio GPU 加速卡和 Sapphire Rapids(+HBM)處理器。

    早在 2019 年 11 月,當 Aurora 還僅規(guī)劃了 1 EF 算力時,就有基于 200 個機架布局的猜想 —— 簡單換算是 5000 顆 CPU + 15000 塊 GPU 加速卡,且每個 PVC 大約 66.6 TF 性能。

    當時英特爾在早期芯片上展示了每張卡 40 TF 的性能,而 Aurora 2 EF 的官方參數(shù)則是 54000+ GPU / 18000+ CPU,意味每個 PVC 僅 37 TeraFlops(完全未將 CPU 性能算進去的話)。

    至于 PVC 的功率,可參考額定功率為 60 MW 的 FP64 Vector(2 ExaFlops),那樣系統(tǒng)為每張卡分配的功率或為 1053 W 。若 Frontier 與 Aurora 的開銷類似,預計每個 PVC 的功率在 615 W。

    最終 37 TF 的 PVC 功率為 615 W,而 MI250X 的 47.9 FP 功率僅為 560 W 。不過這里并未深入每張卡的原始性能,及其在特定用例中的特定功能

    舉報

    • 相關推薦
    • DDR4之后 三星將逐步停產(chǎn)HBM2E:轉(zhuǎn)向HBM3EHBM4

      4月24日消息,三星將逐步停產(chǎn)1y/1z制程8Gb DDR4內(nèi)存,并停止HBM2E產(chǎn)品生產(chǎn),轉(zhuǎn)向新一代HBM3E和HBM4研發(fā)。隨著AI、高性能計算需求激增,HBM市場前景廣闊,但三星在該領域落后于SK海力士和美光。為應對競爭,三星需加快技術迭代。美光已通知客戶將停產(chǎn)服務器用DDR4模塊,SK海力士也計劃減少DDR4產(chǎn)量。中國內(nèi)存廠商崛起加劇行業(yè)競爭,長鑫存儲已量產(chǎn)16納米DDR5,并計劃2025年提升產(chǎn)能,2026年進軍LPDDR5和車用DRAM市場,未來或?qū)⑸孀鉎BM領域。

    • 奧迪中國品牌首車定名E5 Sportback!4月23日亮相上海車展

      快科技4月16日消息,奧迪中國首款量產(chǎn)車型終于來了!這款基于AUDI E概念車打造的上汽AUDI品牌首款量產(chǎn)車型正式定名奧迪E5 Sportback”,新車將于4月23日開幕的上海車展正式亮相。從此前曝光的諜照來看,奧迪E5Sportback預計將延續(xù)概念車的整體造型設計,前臉采用封閉式設計,搭配嵌入式大燈和環(huán)狀結構,前包圍帶有通風開口,車頂還裝配有激光雷達,預計具備較高級別的駕駛輔助系統(tǒng)。車身側面,奧迪E5Sportback繼續(xù)采用掀背式設計,結合了旅行車和獵裝車的側面造型,四門無框式車門、隱藏式車門把手、激光雷達、電子外后視鏡等細節(jié)配置也得

    • RTX 5060 Ti 16GB首次跑分!比4060 Ti高出14%

      NVIDIA即將推出的RTX5060Ti16GB顯卡的性能和規(guī)格首次在Geekbench數(shù)據(jù)庫中曝光。RTX5060Ti擁有4608個CUDA核心,最大頻率達到2647MHz,配備了16GBGDDR7顯存,顯存帶寬為28Gbps,采用了128bit顯存位寬。根據(jù)博板堂透露的價格,RTX5060Ti16GB首發(fā)價確定429美金,人民幣定價為3599元;RTX5060Ti8GB首發(fā)價確定379美金,人民幣定價為3199元。

    • Check Point68% 的網(wǎng)絡攻擊始于收件箱,其中 22% 隱藏在 PDF 文件中

      在2024年全球范圍內(nèi),AdobeAcrobat共打開了超過4000億個PDF文件,編輯了160億個文檔。超過87%的機構使用PDF作為業(yè)務通信的標準文件格式?!裣嘈抛约旱闹庇X如果一個PDF文件看起來好得不像真的,有不尋常的格式和錯別字,或者要求提供證書,那么它很可能是一個陷阱。

    • Check Point Quantum防火墻軟件R82版榮獲通用準則EAL4+認證

      Check Point公司宣布其Quantum防火墻軟件R82版本獲得通用準則(Common Criteria)EAL4+級別認證。該認證由德國聯(lián)邦信息安全辦公室(BSI)頒發(fā),評估范圍涵蓋安全網(wǎng)關、安全管理及Maestro超大規(guī)模網(wǎng)絡編排器等組件。EAL4+是商業(yè)技術產(chǎn)品中廣泛認可的高保障級別,證明該平臺符合嚴格國際標準,能為關鍵基礎設施和政府機構提供可信安全保障。此次認證進一步鞏固了Check Point作為全球網(wǎng)絡安全解決方案提供商的領先地位,其產(chǎn)品已在30多個國家部署。公司表示將持續(xù)為監(jiān)管行業(yè)客戶提供可驗證的安全保障。

    • REDMI Turbo 4 Pro外觀首次公布 配備金屬邊框

      小米新機Turbo4Pro于4月24日19:00開啟預售,預計在發(fā)布后立即吸引大量關注,其創(chuàng)新并改進了原有Turbo4的性能,提高了續(xù)航能力,有助于改善移動體驗,優(yōu)化了散熱系統(tǒng)。該機在性能上搭載了Turbo4的增強版,且預裝了MIUI的最新版本,不支持高刷新率。Turbo4Pro在外觀設計上采用了類似于小米10 Pro的輕薄設計,通過超聲波清潔技術提高了清潔效果。在發(fā)布前,該機已經(jīng)獲得了大量期?

    • 英特爾宣布裁員20%,或超 2 萬人失業(yè)!

      “組織的復雜性和官僚主義正在慢慢扼殺我們獲得勝利所需的創(chuàng)新文化”,英特爾CEO陳立武如是說道……

    • Windows Arm64 托管運行正式支持 GitHub Actions,加速開發(fā)流程

      Arm與GitHub深化合作,為Arm平臺開發(fā)者提供更高效的開發(fā)體驗。

    • AMD RX 9060 XT 8GB不會取消!與16GB版本還是同天

      快科技5月2日消息,根據(jù)最新消息,AMD仍將推出8GB版本的Radeon RX 9060 XT顯卡,并且該版本將與16GB版本在同一天上市。此前,市場上曾有傳聞稱AMD可能會取消8GB版本的RX 9060 XT,或者僅為其分配有限的產(chǎn)能,但根據(jù)BenchLife的報道,這些傳聞并不屬實。BenchLife指出,AMD不太可能在產(chǎn)品尚未推出之前就停止供貨或取消,因為其AIB合作伙伴已經(jīng)備貨并開始生產(chǎn)。因此在開賣初期,RX 9060 XT的16GB和8GB版本都會同時出現(xiàn)在市場上。不過,后續(xù)AIB合作伙伴會根據(jù)市場銷售情況對產(chǎn)品進行調(diào)整,預計16GB版本的市場需求可能會大于8GB版本。從市場反

    • REDMI Turbo 4 Pro跑分公布:破240萬 首發(fā)第四代驍龍8s

      Redmi Turbo4 Pro將于4月24日19:00發(fā)布,搭載高通第四代驍龍8移動平臺,性能顯著提升,采用全新大核設計,配備Adreno 825 GPU,屏幕為6.83英寸1.5K LTPS直屏,支持光學指紋識別技術,內(nèi)置7550mAh大電池并支持90W快充,同時在影像系統(tǒng)上也進行了大幅升級,滿足用戶多樣化拍攝需求。