作為各家新處理器、新顯卡平臺中最后一個登場的,AMD RDNA3架構(gòu)的RX 7000系列顯卡終于來了!
新品正式解禁上市前,AMD也向快科技分享了諸多細節(jié),包括芯片設計、架構(gòu)布局、技術特性等,一起先睹為快!
AMD高級副總裁、大中華區(qū)總裁潘曉明先生(Spencer Pan)表示,AMD一直致力于將優(yōu)異的Radeon顯卡帶給發(fā)燒友和游戲市場,用不斷精進的圖形能力令用戶收獲極致體驗,用一款又一款的優(yōu)秀產(chǎn)品引領行業(yè)進入一個全新高性能時代。
對于全新的RX 7000系列顯卡,潘曉明一樣充滿了期待與憧憬,并強調(diào),AMD將一如既往的為廣大玩家和行業(yè)帶來優(yōu)秀的產(chǎn)品,滿足時代的需求。
AMD Radeon技術事業(yè)部工程研發(fā)高級副總裁王啟尚表示,AMD的愿景是為全世界數(shù)十億的游戲玩家能夠提供更卓越的游戲體驗,包括銳龍?zhí)幚砥?、Radeon顯卡、云游戲服務,以及PS5、Xbox Series X/S、Valve Steam Deck新一代的游戲機,還有最新的特斯拉電動汽車,把游戲體驗帶進汽車市場。
OK,接下來進入RDNA3的奇妙世界。
眾所周知,如今的高端GPU越發(fā)復雜、龐大,晶體管數(shù)量動輒幾百億,盡管有更先進工藝的加持,但在性能提升的同時,功耗也急劇飆升,不得設計夸張的散熱方案,甚至離不開水冷,導致能效比(每瓦性能)非常差。
AMD RDNA則從誕生開始就是一個極其高能效的GPU架構(gòu)。初代就比此前的Vega架構(gòu)在能效提升了多達50%,RDNA2又提升了54%,如今的RDNA3居然再次提升了54%,又一次超越了原定的設計目標!
三代RDNA架構(gòu)發(fā)展下來,能效累計提升幅度已經(jīng)超過350%,在整個GPU歷史上都堪稱一個奇跡。
RDNA3架構(gòu)最大的創(chuàng)新之一,就是將AMD銳龍、EPYC上大獲成功的chiplet小芯片設計,第一次引入到了GPU之上。
AMD將一顆完整的大芯片按照功能模塊劃分成不同的小芯片,各自使用最合適的制造工藝,再通過帶寬高達5.3TB/s的高性能扇出型封裝互連,組合成一個有機的整體。
RDNA3家族的頂級核心Navi 31,一共包括一個GCD、六個MCD。
其中,GCD也就是Graphics Compute Die,包括計算單元、顯示單元、媒體單元等,采用先進、昂貴的5nm制造工藝,面積約306平方毫米。
MCD也就是Memory Cache Die,包括顯存、Infinity Cache無限緩存,采用成熟的6nm制造工藝,單個面積約37.5平方毫米。
Navi 31核心總面積約531平方毫米,共有577億個晶體管,集成密度約1.1億個晶體管/平方毫米。
相比之下,RX 6900系列所用的Navi 21核心為單芯片設計,臺積電7nm,268億晶體管,面積519平方毫米,集成密度約5160萬晶體管/平方毫米。
換言之,Navi 31在總面積幾乎不變的情況下,晶體管數(shù)量翻番,密度也翻了一倍。
作為對比,NVIDIA RTX 4090 AD102核心仍是單芯片,臺積電4N工藝(本質(zhì)也是5nm),608平方毫米,763億晶體管,集成密度1.26億個/平方毫米。
MCD部分比較簡單,每顆內(nèi)部集成一個64-bit GDDR6顯存控制器、16MB Infinity Cache無限緩存,后者頻率為2.3GHz。
六顆組成384-bit、96MB的規(guī)格,合計帶寬最高達5.3TB/s,比RDNA2架構(gòu)提升了足足2.7倍。
其中單純由384-bit 20GHz GDDR6顯存提供的帶寬最高為960GB/s,剩下的超過80%都來自Infinity Cache。
那么,為什么還是不使用更高頻率的GDDR6X顯存?
王啟尚指出,RDNA 3架構(gòu)旨在提高能效,而GDDR6X顯存需要更高的供電以維持更高的帶寬。AMD Infinity Cache這樣的創(chuàng)新技術搭配GDDR6,就可以在更低的功耗下,實現(xiàn)更高的顯存帶寬性能。
GCD部分主要可以分為三大塊兒,分別是統(tǒng)一計算單元、顯示引擎、雙媒體引擎,都是全新設計的。
接下來,我們逐一看下這三大件。
CU計算單元,仍然是RDNA3的基本組成模塊,但這次煥然一新,而且有了新名字,叫做統(tǒng)一計算單元”。
何謂統(tǒng)一?就是圖形渲染、光線追蹤、人工智能可以共享所有的計算資源,提供更高的單位功耗性能、單位面積性能。
計算單元內(nèi)部又可以分為幾個不同功能模塊,首先是VGPR(通用寄存器),負責資源的共享與調(diào)度分配,其容量比RDNA2上增加了50%,從而提升了所有功能的性能。
順帶一提,計算單元部分的集成度非常高,單位面積晶體管比上代增加了足足165%。
流失處理器模塊,RDNA3架構(gòu)邁進了一大步,采用Dual Issue也就是雙路發(fā)射設計,能夠向Wave32 SMID單元同時派發(fā)兩路不同的指令。
這個指令可以是整數(shù),可以是浮點,可以是AI,看需要而定。
這就讓指令分發(fā)效率直接提升了一倍,可以更好地利用計算單元中的所有功能,達成更高的性能、能效,而且混合指令的利用也更加靈活、高效。
RDNA3還極大地強化了AI,每個計算單元內(nèi)有兩個AI加速器,并加入新的AI指令,提升AI吞吐量,綜合性能提升超過2.7倍,可以輕松滿足當下乃至未來AI加速場景的需求。
光線追蹤也進化為新一代,可實時跟蹤的光線數(shù)量增加了多達1.5倍,還有新的光追專用指令集、新的光線盒排序與遍歷算法。
最終,RDNA3每個計算單元的光追性能提升了多達50%,雖然不能說超越對手,但至少大大縮小了差距。
RDNA3架構(gòu)還設計了新的時鐘頻率解耦”(Decoupled Clocks)機制,也就是讓著色器、前端的工作頻率彼此獨立,都跑在最合適的頻率上。
其中,前端頻率為2.5GHz,比上代提高了15%,可以更高效地處理工作負載;著色器頻率為2.3GHz,能效更高,可以節(jié)省最多25%的功耗。
這一設計也為整體能效再進一步做了很大的貢獻。
總的來說,憑借一系列改進,RDNA3的計算性能提升了足足2.7倍,浮點計算能力達到61TFlops(每秒61萬億次計算)。
多媒體一直是AMD GPU的強項,各種新技術、新標準總是會優(yōu)先嘗試。
RDNA3集成了新的Radiance顯示引擎,不但支持HDMI 2.1a,還行業(yè)第一家率先支持最新的DisplayPort 2.1視頻輸出標準,包括UHBR 13.5,而現(xiàn)在距離新標準正式發(fā)布還不到一個月!
DP 1.2可提供最高54Gbps的顯示鏈接帶寬,這足以支持8K165Hz、4K480Hz、2K900Hz的超高清高刷顯示輸出,還能以每通道12-bit色深,渲染出驚人的680億種顏色。
支持如此超高分辨率、超高刷新率,一方面可以顯示更豐富、更高質(zhì)量的視頻內(nèi)容,另一方面也可以更適應超高幀率游戲。
RX 7900系列本就是面向未來4K游戲的,而在當下主流的2K分辨率,很多游戲都可以跑出超高幀率,比如《守望先鋒2》超過600FPS,《無畏契約》超過800FPS,使用DP2.1可以讓游戲幀率、顯示器刷新率更加匹配,游戲體驗更加絲滑。
戴爾、三星、華碩、LG、宏碁等都在開發(fā)DP 2.1接口的顯示器,預計將從2013年初開始陸續(xù)上市。
最后是新的雙媒體引擎,頻率提升多達80%,首次加入了對AV1格式的支持,可以做到8K60的編碼、解碼。
目前,各家GPU方案都已經(jīng)完整支持AV1,再加上移動SoC的跟進,硬件平臺已經(jīng)完全到位。
另外,RDNA3還支持AVC、HEVC(H.265)格式的同步編解碼,效率更高,并引入了AI增強視頻編碼,包括串流預分析、串流預濾波等。
值得一提的是,RDNA3架構(gòu)還支持全新的SmartAccess Video協(xié)同編解碼技術,可在銳龍?zhí)幚砥?、Radeon顯卡之間智能劃分解碼和編碼工作負載,4K分辨率下的多串流編碼中,可提供最高30%的性能提升。
匯總一下RDNA3 Navi 31 GPU的主要亮點:
1、首次小芯片設計,頻率提升15%,能效提升54%。
2、峰值帶寬提升2.7倍,浮點性能高達61TFlops。
3、統(tǒng)一計算單元,每時鐘周期雙指令發(fā)射,升級光追單元,加入AI單元。
4、全新顯示、媒體引擎,完整支持DP 2.1輸出、AV1編解碼。
游戲特性方面,重點說一下AMD FSR。
截止10月底,AMD FSR超分辨率技術已經(jīng)覆蓋216款游戲,其中85款已為最新的FSR 2.x。
下一個小”版本是FSR 2.2,重點進一步改善畫質(zhì),比如減少快速移動物體的重影,同樣基于時域放大算法,不需要依靠AI或者專用的AI硬件,《極限競速:地平線5》首發(fā)支持。
下一個大”版本是FSR 3,支持全新的AMD Fluid Motion Frame補幀技術,預計可帶來比FRS 2最多2倍的幀率提升,2023年推出,正面對標NVIDIA DLSS 3。
產(chǎn)品方面首發(fā)兩款,再回顧下主要規(guī)格:
RX 7900 XTX:
96個計算單元,96MB Infinity Cache緩存,核心游戲頻率2.3GHz、最高就是頻率2.5GHz,搭配384-bit 24GB GDDR6顯存,等效頻率20GHz,整卡功耗355W。
RX 7900 XT:
84個計算單元也就是精簡1/8,Infinity Cache緩存減少到80MB,核心游戲、加速頻率分別降至2.0GHz、2.4GHz,顯存位寬降至320-bit,容量20GB,整卡功耗也降至300W。
值得一提的是,AMD(ATI)上一次使用XTX”為旗艦顯卡命名,還要追溯到2006年的 Radeon X1950 XTX、X1900 XTX,已經(jīng)過去了16年之久。
AMD表示,選擇讓XTX品牌回歸,意在向世界宣布RX 7900 XTX將是AMD中更強大的顯卡。
RX 7900系列公版設計基本延續(xù)了RX 6900系列的風格,三風扇,標準2.5插槽厚度,長度從276mm略微延長到287mm,機箱兼容方面不會增加困難。
輔助供電接口仍是兩個標準的PCIe 8針,而沒有使用新的、容易莫名燒毀的PCIe 5.0 12VHPWR 16針接口,確保兼容性和安全性,同時供電能力從330W增加到355W,可以提供更充裕的空間。
性能方面,解禁之前先看看一些官方數(shù)據(jù)。
RX 7900 XTX 4K游戲性能相比于RX 6950 XT提升最多達70%,大量游戲可提升50%。
RX 7900 XT也能帶來最多50%的性能提升。
光追性能也取得了巨大的進步,4K分辨率和超高畫質(zhì)下,《賽博朋克2077》、《消逝的光芒》、《殺手3》等游戲可帶來50-80%的性能飛躍,都輕松超過60FPS的平均幀率及格線。
顯卡將于12月13日正式上市,RX 7900 XTX定價僅為7999元,相比RTX 4090便宜了接近40%,預計和RTX 4080基本在同一檔次,但性能顯然會碾壓后者。
RX 7900 XT定價為7399元,勢必會給只有192-bit顯存的RTX 4070 Ti以極大的壓力。
王啟尚也強調(diào),AMD的理念是希望能夠把發(fā)燒級的、面相未來的顯卡,用比較親民的價錢,讓更多的游戲玩家能夠有全新的體驗。
華擎、華碩、技嘉、微星、撼迅、藍寶石、瀚鎧、訊景、盈通等品牌都會在第一時間發(fā)布各自的RX 7900系列顯卡,并同步上市。
備貨方面,AMD表示整個團隊都在夜以繼日地準備供貨,預計應該是充足的,但不排除玩家熱烈追捧,初期供需緊張。
(舉報)