近日有消息稱(chēng),英偉達(dá)正在開(kāi)發(fā)一款 Hopper H100 PCIe 加速卡,特點(diǎn)是具有高達(dá) 120GB 的 HBM2e 顯存。截至目前,該公司已經(jīng)發(fā)布了兩個(gè)版本的 Hopper H100 GPU,分別是 SXM5 和 PCIe 板型。雖然兩款 SKU 都配備了 80GB VRAM,但前者用上了全新的 HBM3 標(biāo)準(zhǔn)、而后者仍為 HBM2e 。
最新消息是,據(jù) s-ss.cc 爆料,英偉達(dá)可能正在開(kāi)發(fā)全新的 PCIe 擴(kuò)展卡版本的 Hopper H100 GPU —— 但它并未配備 80GB HBM2e VRAM、而是增加到了 120GB 。
消息稱(chēng)這張新卡配備了六個(gè) HBM2e 堆棧、擁有 6144-bit 總線位寬 @ 120GB VRAM、輔以 SXM5 同款 GH100 GPU 。
總計(jì) 16896 個(gè) CUDA 核心、帶寬超 3 TB/s、單精度性能 30 TFLOPS —— 與 SXM5 版本相當(dāng)。
照此規(guī)格,英偉達(dá) Hopper GH100 GPU 擁有 144 組 SM 流處理器 / 8 個(gè) GPC —— 每組 GPC 包含 9 個(gè) TPC,每 TPC 由 2 組 SM 單元組成。
每組 SM 單元最多由 128 個(gè) FP32 單元,那樣滿(mǎn)血版應(yīng)該是 18432 個(gè) CUDA 核心。
GH100 GPU 完整規(guī)格參考:
● 每顆 GPU 擁有 8 GPC、72 TPCs(9 TPC / GPC)、2 SM / TPC、144 SM 單元
● 每組 SM 單元擁有 128 個(gè) FP32 CUDA 核心,每顆 GPU 擁有 18432 個(gè) FP32 CUDA 核心。
● 每組 SM 單元擁有 4 個(gè)第四代張量核心,每顆 GPU 擁有完整 576 個(gè) Tensor Cores 。
● 6 組 HBM3 或 HBM2e 顯存堆棧,輔以 12 個(gè) @ 512-bit 顯存控制器。
● 配備 60 MB 二級(jí)緩存
以下是 SXM5 外形的 NVIDIA H100 GPU 規(guī)格:
● 每顆 GPU 擁有 8 GPC / 66 TPC、2 SM / TPC、132 SM 單元
● 每組 SM 單元擁有 128 個(gè) FP32 CUDA 核心,每顆 GPU 擁有 16896 個(gè) FP32 CUDA 核心。
● 每組 SM 單元擁有 4 個(gè)第四代張量核心,每顆 GPU 擁有 528 個(gè) Tensor Cores 。
● 5 組 @ 80GB HBM3 顯存堆棧,輔以 10 個(gè) @ 512-bit 顯存控制器。
● 配備 50MB 二級(jí)緩存
● 支持第四代 NVLink 和 PCIe 5.0
目前尚不清楚英偉達(dá)正在搞測(cè)試原型,還是醞釀推出 Hopper H100 GPU 的未來(lái)迭代。
不過(guò)該公司最近在 GTC 2022 大會(huì)上表示,Hopper GPU 現(xiàn)已全面投產(chǎn),預(yù)計(jì)首批產(chǎn)品會(huì)在下月到來(lái)。
(舉報(bào))