站長之家(ChinaZ.com) 7月24日消息:Cerberas 和 G42 推出了 4 Exaflops Condor Galaxy 1 AI 超級計算機,其中包含數(shù)千個 AMD EPYC 處理器單元和數(shù)百萬個 AI 核心。
圖片來自Cerebras
Cerebras 和 G42 合作,將開創(chuàng)云計算和生成式人工智能領(lǐng)域的新局面。兩家公司將共同開發(fā)九種不同的超級計算機,其中最引人注目的是 CG-1(Condor Galaxy 1),預計將擁有全球第一的 4 ExaFLOPS 計算能力。
Condor Galaxy 1 AI 超級計算機規(guī)格:
- 在 FP16 上實現(xiàn) 4 exaFLOPS 的稀疏 AI 計算
- 5400 萬個 AI 優(yōu)化計算核心
- 82 TB 內(nèi)存
- 64 個 Cerebras CS-2 系統(tǒng)
- 基本配置支持 6000 億個參數(shù),可擴展至 100 萬億個。
- 386 TB內(nèi)部集群結(jié)構(gòu)帶寬
- 72,704 個 AMD EPYC 第 3 代處理器內(nèi)核
- 本機硬件支持 50,000 個令牌序列長度的訓練,無需第三方庫。
- 具有線性性能擴展的數(shù)據(jù)并行編程模型
也許你第一次聽說這兩家公司,但它們都長期以來一直在從事技術(shù)開發(fā)。Cerebras Systems 以其在生成式人工智能領(lǐng)域的努力而聞名,主要通過其 CS-2 Wafer Scale Engine 實現(xiàn)了 2.6 萬億個晶體管的驚人里程碑。該芯片被稱為有史以來最大的芯片,被稱為「單個 CS-2 系統(tǒng),類似于一個超級計算機」。
然而,Cerebras 與 G42 合作,通過他們的新型超級計算機向前邁出了一步。兩家公司已經(jīng)公布了關(guān)于 CG-1 的細節(jié),預計它將在行業(yè)中樹立新的標桿。根據(jù)博客文章,CG-1 與 64 臺 Cerebras CS-2 系統(tǒng)相連,將它們合并成一個單一的超級計算機,總計計算能力為 4 ExaFLOPS。
當前活躍的超級計算機中,由 AMD 驅(qū)動的 Frontier 據(jù)說配備了 1.1 ExaFLOPS。CG-1 幾乎是其四倍,這在超級計算機行業(yè)是一個龐大的數(shù)字。Cerebras 的首席執(zhí)行官 Andrew Feldman 對此表示:
以 FP16 提供 4 ExaFLOPS 的 AI 計算,CG-1 大大縮短了 AI 訓練時間,同時消除了分布式計算的痛苦。
許多云公司宣布了龐大的 GPU 集群,花費數(shù)十億美元進行構(gòu)建,但使用起來非常困難。在數(shù)千個小型 GPU 上分布單個模型需要幾個月的時間,需要數(shù)十名專業(yè)人員進行操作。CG-1 消除了這一挑戰(zhàn)。
深入了解 CG-1 超級計算機的規(guī)格,它具有 4 ExaFLOPS 的 16 位計算能力,以及 6000 億個參數(shù)模型。據(jù)稱,系統(tǒng)配備了 5400 萬個 AI 優(yōu)化計算核心,每秒 388 TB 的互連帶寬和 72,704 個 AMD EPYC CPU 核心。這款設備與我們之前見過的任何產(chǎn)品都不同,根據(jù)公開的數(shù)據(jù),CG-1 準備在行業(yè)中占據(jù)主導地位。
Cerebras 和 G42 的雄心并未止步于此,該公司計劃互連三臺超級計算機(CG-1. CG-2 和 CG-3),目標是達到 12 ExaFLOPS,這是一個巨大的里程碑。此外,該公司計劃在 2024 年推出六臺超級計算機,總計計算能力將達到 36 ExaFLOPS。這些披露的雄心壯志是巨大的,這可能會開啟云計算和生成式人工智能行業(yè)的新時代。
(舉報)