中文字幕欧美日韩|日韩性色一区二区三区|精品久久久久久久久久岛国|一区二区国产盗摄精品

    <td id="h1kkc"><tr id="h1kkc"></tr></td><noscript id="h1kkc"><tbody id="h1kkc"></tbody></noscript>
    <rp id="h1kkc"></rp>
    首頁 > 業(yè)界 > 關鍵詞  > InfinityCache最新資訊  > 正文

    AMD RDNA3架構(gòu)深入揭秘:一大分七小、AI/光追飛躍!

    2022-11-14 20:49 · 稿源: 快科技

    作為各家新處理器、新顯卡平臺中最后一個登場的,AMD RDNA3架構(gòu)的RX 7000系列顯卡終于來了!

    新品正式解禁上市前,AMD也向快科技分享了諸多細節(jié),包括芯片設計、架構(gòu)布局、技術特性等,一起先睹為快!

    AMD高級副總裁、大中華區(qū)總裁潘曉明先生(Spencer Pan)表示,AMD一直致力于將優(yōu)異的Radeon顯卡帶給發(fā)燒友和游戲市場,用不斷精進的圖形能力令用戶收獲極致體驗,用一款又一款的優(yōu)秀產(chǎn)品引領行業(yè)進入一個全新高性能時代。

    對于全新的RX 7000系列顯卡,潘曉明一樣充滿了期待與憧憬,并強調(diào),AMD將一如既往的為廣大玩家和行業(yè)帶來優(yōu)秀的產(chǎn)品,滿足時代的需求。

    AMD Radeon技術事業(yè)部工程研發(fā)高級副總裁王啟尚表示,AMD的愿景是為全世界數(shù)十億的游戲玩家能夠提供更卓越的游戲體驗,包括銳龍?zhí)幚砥?、Radeon顯卡、云游戲服務,以及PS5、Xbox Series X/S、Valve Steam Deck新一代的游戲機,還有最新的特斯拉電動汽車,把游戲體驗帶進汽車市場。

    OK,接下來進入RDNA3的奇妙世界。

    AMD RDNA3架構(gòu)深入揭秘:一大分七小、AI/光追飛躍!

    眾所周知,如今的高端GPU越發(fā)復雜、龐大,晶體管數(shù)量動輒幾百億,盡管有更先進工藝的加持,但在性能提升的同時,功耗也急劇飆升,不得設計夸張的散熱方案,甚至離不開水冷,導致能效比(每瓦性能)非常差。

    AMD RDNA則從誕生開始就是一個極其高能效的GPU架構(gòu)。初代就比此前的Vega架構(gòu)在能效提升了多達50%,RDNA2又提升了54%,如今的RDNA3居然再次提升了54%,又一次超越了原定的設計目標!

    三代RDNA架構(gòu)發(fā)展下來,能效累計提升幅度已經(jīng)超過350%,在整個GPU歷史上都堪稱一個奇跡。

    AMD RDNA3架構(gòu)深入揭秘:一大分七小、AI/光追飛躍!

    RDNA3架構(gòu)最大的創(chuàng)新之一,就是將AMD銳龍、EPYC上大獲成功的chiplet小芯片設計,第一次引入到了GPU之上

    AMD將一顆完整的大芯片按照功能模塊劃分成不同的小芯片,各自使用最合適的制造工藝,再通過帶寬高達5.3TB/s的高性能扇出型封裝互連,組合成一個有機的整體。

    RDNA3家族的頂級核心Navi 31,一共包括一個GCD、六個MCD。

    其中,GCD也就是Graphics Compute Die,包括計算單元、顯示單元、媒體單元等,采用先進、昂貴的5nm制造工藝,面積約306平方毫米。

    MCD也就是Memory Cache Die,包括顯存、Infinity Cache無限緩存,采用成熟的6nm制造工藝,單個面積約37.5平方毫米。

    Navi 31核心總面積約531平方毫米,共有577億個晶體管,集成密度約1.1億個晶體管/平方毫米。

    相比之下,RX 6900系列所用的Navi 21核心為單芯片設計,臺積電7nm,268億晶體管,面積519平方毫米,集成密度約5160萬晶體管/平方毫米。

    換言之,Navi 31在總面積幾乎不變的情況下,晶體管數(shù)量翻番,密度也翻了一倍。

    作為對比,NVIDIA RTX 4090 AD102核心仍是單芯片,臺積電4N工藝(本質(zhì)也是5nm),608平方毫米,763億晶體管,集成密度1.26億個/平方毫米。

    AMD RDNA3架構(gòu)深入揭秘:一大分七小、AI/光追飛躍!

    MCD部分比較簡單,每顆內(nèi)部集成一個64-bit GDDR6顯存控制器、16MB Infinity Cache無限緩存,后者頻率為2.3GHz。

    六顆組成384-bit、96MB的規(guī)格,合計帶寬最高達5.3TB/s,比RDNA2架構(gòu)提升了足足2.7倍。

    其中單純由384-bit 20GHz GDDR6顯存提供的帶寬最高為960GB/s,剩下的超過80%都來自Infinity Cache。

    那么,為什么還是不使用更高頻率的GDDR6X顯存?

    王啟尚指出,RDNA 3架構(gòu)旨在提高能效,而GDDR6X顯存需要更高的供電以維持更高的帶寬。AMD Infinity Cache這樣的創(chuàng)新技術搭配GDDR6,就可以在更低的功耗下,實現(xiàn)更高的顯存帶寬性能。

    AMD RDNA3架構(gòu)深入揭秘:一大分七小、AI/光追飛躍!

    GCD部分主要可以分為三大塊兒,分別是統(tǒng)一計算單元、顯示引擎、雙媒體引擎,都是全新設計的。

    接下來,我們逐一看下這三大件。

    AMD RDNA3架構(gòu)深入揭秘:一大分七小、AI/光追飛躍!

    CU計算單元,仍然是RDNA3的基本組成模塊,但這次煥然一新,而且有了新名字,叫做統(tǒng)一計算單元”。

    何謂統(tǒng)一?就是圖形渲染、光線追蹤、人工智能可以共享所有的計算資源,提供更高的單位功耗性能、單位面積性能。

    計算單元內(nèi)部又可以分為幾個不同功能模塊,首先是VGPR(通用寄存器),負責資源的共享與調(diào)度分配,其容量比RDNA2上增加了50%,從而提升了所有功能的性能。

    順帶一提,計算單元部分的集成度非常高,單位面積晶體管比上代增加了足足165%。

    AMD RDNA3架構(gòu)深入揭秘:一大分七小、AI/光追飛躍!

    流失處理器模塊,RDNA3架構(gòu)邁進了一大步,采用Dual Issue也就是雙路發(fā)射設計,能夠向Wave32 SMID單元同時派發(fā)兩路不同的指令。

    這個指令可以是整數(shù),可以是浮點,可以是AI,看需要而定。

    這就讓指令分發(fā)效率直接提升了一倍,可以更好地利用計算單元中的所有功能,達成更高的性能、能效,而且混合指令的利用也更加靈活、高效。

    AMD RDNA3架構(gòu)深入揭秘:一大分七小、AI/光追飛躍!

    RDNA3還極大地強化了AI,每個計算單元內(nèi)有兩個AI加速器,并加入新的AI指令,提升AI吞吐量,綜合性能提升超過2.7倍,可以輕松滿足當下乃至未來AI加速場景的需求。

    AMD RDNA3架構(gòu)深入揭秘:一大分七小、AI/光追飛躍!

    光線追蹤也進化為新一代,可實時跟蹤的光線數(shù)量增加了多達1.5倍,還有新的光追專用指令集、新的光線盒排序與遍歷算法。

    最終,RDNA3每個計算單元的光追性能提升了多達50%,雖然不能說超越對手,但至少大大縮小了差距。

    AMD RDNA3架構(gòu)深入揭秘:一大分七小、AI/光追飛躍!

    RDNA3架構(gòu)還設計了新的時鐘頻率解耦”(Decoupled Clocks)機制,也就是讓著色器、前端的工作頻率彼此獨立,都跑在最合適的頻率上。

    其中,前端頻率為2.5GHz,比上代提高了15%,可以更高效地處理工作負載;著色器頻率為2.3GHz,能效更高,可以節(jié)省最多25%的功耗。

    這一設計也為整體能效再進一步做了很大的貢獻。

    總的來說,憑借一系列改進,RDNA3的計算性能提升了足足2.7倍,浮點計算能力達到61TFlops(每秒61萬億次計算)。

    AMD RDNA3架構(gòu)深入揭秘:一大分七小、AI/光追飛躍!

    多媒體一直是AMD GPU的強項,各種新技術、新標準總是會優(yōu)先嘗試。

    RDNA3集成了新的Radiance顯示引擎,不但支持HDMI 2.1a,還行業(yè)第一家率先支持最新的DisplayPort 2.1視頻輸出標準,包括UHBR 13.5,而現(xiàn)在距離新標準正式發(fā)布還不到一個月!

    DP 1.2可提供最高54Gbps的顯示鏈接帶寬,這足以支持8K165Hz、4K480Hz、2K900Hz的超高清高刷顯示輸出,還能以每通道12-bit色深,渲染出驚人的680億種顏色。

    支持如此超高分辨率、超高刷新率,一方面可以顯示更豐富、更高質(zhì)量的視頻內(nèi)容,另一方面也可以更適應超高幀率游戲。

    RX 7900系列本就是面向未來4K游戲的,而在當下主流的2K分辨率,很多游戲都可以跑出超高幀率,比如《守望先鋒2》超過600FPS,《無畏契約》超過800FPS,使用DP2.1可以讓游戲幀率、顯示器刷新率更加匹配,游戲體驗更加絲滑。

    戴爾、三星、華碩、LG、宏碁等都在開發(fā)DP 2.1接口的顯示器,預計將從2013年初開始陸續(xù)上市。

    AMD RDNA3架構(gòu)深入揭秘:一大分七小、AI/光追飛躍!

    最后是新的雙媒體引擎,頻率提升多達80%,首次加入了對AV1格式的支持,可以做到8K60的編碼、解碼。

    目前,各家GPU方案都已經(jīng)完整支持AV1,再加上移動SoC的跟進,硬件平臺已經(jīng)完全到位。

    另外,RDNA3還支持AVC、HEVC(H.265)格式的同步編解碼,效率更高,并引入了AI增強視頻編碼,包括串流預分析、串流預濾波等。

    值得一提的是,RDNA3架構(gòu)還支持全新的SmartAccess Video協(xié)同編解碼技術,可在銳龍?zhí)幚砥?、Radeon顯卡之間智能劃分解碼和編碼工作負載,4K分辨率下的多串流編碼中,可提供最高30%的性能提升。

    匯總一下RDNA3 Navi 31 GPU的主要亮點:

    1、首次小芯片設計,頻率提升15%,能效提升54%。

    2、峰值帶寬提升2.7倍,浮點性能高達61TFlops。

    3、統(tǒng)一計算單元,每時鐘周期雙指令發(fā)射,升級光追單元,加入AI單元。

    4、全新顯示、媒體引擎,完整支持DP 2.1輸出、AV1編解碼。

    AMD RDNA3架構(gòu)深入揭秘:一大分七小、AI/光追飛躍!

    AMD RDNA3架構(gòu)深入揭秘:一大分七小、AI/光追飛躍!

    游戲特性方面,重點說一下AMD FSR。

    截止10月底,AMD FSR超分辨率技術已經(jīng)覆蓋216款游戲,其中85款已為最新的FSR 2.x。

    下一個小”版本是FSR 2.2,重點進一步改善畫質(zhì),比如減少快速移動物體的重影,同樣基于時域放大算法,不需要依靠AI或者專用的AI硬件,《極限競速:地平線5》首發(fā)支持。

    下一個大”版本是FSR 3,支持全新的AMD Fluid Motion Frame補幀技術,預計可帶來比FRS 2最多2倍的幀率提升,2023年推出,正面對標NVIDIA DLSS 3。

    產(chǎn)品方面首發(fā)兩款,再回顧下主要規(guī)格:

    RX 7900 XTX:

    96個計算單元,96MB Infinity Cache緩存,核心游戲頻率2.3GHz、最高就是頻率2.5GHz,搭配384-bit 24GB GDDR6顯存,等效頻率20GHz,整卡功耗355W。

    RX 7900 XT:

    84個計算單元也就是精簡1/8,Infinity Cache緩存減少到80MB,核心游戲、加速頻率分別降至2.0GHz、2.4GHz,顯存位寬降至320-bit,容量20GB,整卡功耗也降至300W。

    值得一提的是,AMD(ATI)上一次使用XTX”為旗艦顯卡命名,還要追溯到2006年的 Radeon X1950 XTX、X1900 XTX,已經(jīng)過去了16年之久。

    AMD表示,選擇讓XTX品牌回歸,意在向世界宣布RX 7900 XTX將是AMD中更強大的顯卡。

    AMD RDNA3架構(gòu)深入揭秘:一大分七小、AI/光追飛躍!

    RX 7900系列公版設計基本延續(xù)了RX 6900系列的風格,三風扇,標準2.5插槽厚度,長度從276mm略微延長到287mm,機箱兼容方面不會增加困難。

    輔助供電接口仍是兩個標準的PCIe 8針,而沒有使用新的、容易莫名燒毀的PCIe 5.0 12VHPWR 16針接口,確保兼容性和安全性,同時供電能力從330W增加到355W,可以提供更充裕的空間。

    AMD RDNA3架構(gòu)深入揭秘:一大分七小、AI/光追飛躍!

    性能方面,解禁之前先看看一些官方數(shù)據(jù)。

    RX 7900 XTX 4K游戲性能相比于RX 6950 XT提升最多達70%,大量游戲可提升50%。

    RX 7900 XT也能帶來最多50%的性能提升。

    AMD RDNA3架構(gòu)深入揭秘:一大分七小、AI/光追飛躍!

    AMD RDNA3架構(gòu)深入揭秘:一大分七小、AI/光追飛躍!

    AMD RDNA3架構(gòu)深入揭秘:一大分七小、AI/光追飛躍!

    光追性能也取得了巨大的進步,4K分辨率和超高畫質(zhì)下,《賽博朋克2077》、《消逝的光芒》、《殺手3》等游戲可帶來50-80%的性能飛躍,都輕松超過60FPS的平均幀率及格線。

    AMD RDNA3架構(gòu)深入揭秘:一大分七小、AI/光追飛躍!

    顯卡將于12月13日正式上市,RX 7900 XTX定價僅為7999元,相比RTX 4090便宜了接近40%,預計和RTX 4080基本在同一檔次,但性能顯然會碾壓后者。

    RX 7900 XT定價為7399元,勢必會給只有192-bit顯存的RTX 4070 Ti以極大的壓力。

    王啟尚也強調(diào),AMD的理念是希望能夠把發(fā)燒級的、面相未來的顯卡,用比較親民的價錢,讓更多的游戲玩家能夠有全新的體驗。

    華擎、華碩、技嘉、微星、撼迅、藍寶石、瀚鎧、訊景、盈通等品牌都會在第一時間發(fā)布各自的RX 7900系列顯卡,并同步上市。

    備貨方面,AMD表示整個團隊都在夜以繼日地準備供貨,預計應該是充足的,但不排除玩家熱烈追捧,初期供需緊張。

    舉報

    • 相關推薦
    • 美國封鎖沒意義!揭秘華為384顆自研芯片方案 領先英偉達AMD一代

      快科技5月2日消息,美國封鎖芯片對華出口,這讓英偉達CEO黃仁勛倍感焦慮,因為他深知中國國產(chǎn)算力目前達到了怎樣的水平。前段時間華為推出了AI算力集群解決方案CloudMatrix 384,這在外行看來似乎沒有什么不同,但如果仔細剖析其影響可謂深遠。按照華為的說法,CloudMatrix 384基于384顆昇騰芯片構(gòu)建,通過全互連拓撲架構(gòu)實現(xiàn)芯片間高效協(xié)同,可提供高達300 PFLOPs的密集BF16算力,接近達到英偉達GB200 NVL72系統(tǒng)的兩倍。此外,CM384在內(nèi)存容量和帶寬方面同樣占據(jù)優(yōu)勢,總內(nèi)存容量超出英偉達方案3.6倍,內(nèi)存帶寬也達到2.1倍,為大規(guī)模AI訓

    • 千問3的屠榜,是AI的一小步,也是阿里的一大

      阿里發(fā)布Qwen3大模型,終結(jié)"阿里是否AI公司"的討論。該模型以4張H20顯卡即可部署,成本僅為同類產(chǎn)品的30%,覆蓋從0.6B到14B全尺寸,適配手機、智能眼鏡等多種設備。阿里CEO吳泳銘宣布未來三年投入超3800億建設云和AI基礎設施,相當于阿里近三年累計利潤總額。文章指出,中國78%受訪者對AI發(fā)展持樂觀態(tài)度,遠超美國的35%。阿里通過開源戰(zhàn)略和云+AI組合拳,已構(gòu)建完整AI生態(tài),其千問系列模型不僅助力夸克、釘釘?shù)犬a(chǎn)品重塑,更成為推動中國產(chǎn)業(yè)智能化轉(zhuǎn)型的核心力量。

    • 北京隊再上大分:新AI一句話就能搞開發(fā),代碼實時可見 | 免費可用

      什么?!現(xiàn)在隨便一個完全不懂編程的人,都可以開發(fā)完整網(wǎng)站了???你沒看錯,現(xiàn)在搞開發(fā)啊,真的就是一句話的事兒。例如你想做一個fashion一點的電商網(wǎng)站,那么你只需要來上一句:然后啊,這個AI就開始思考你需求的意圖了。但畢竟咱們Prompt過于簡單了,于是乎,這個AI還貼心地基于需求,給出了諸多細節(jié)選項,包括:響應式設計,適配不同設備商品分類和搜索功能購物車和結(jié)?

    • OpenAI 要砸 30 億美金收購 AI 編碼工具 Windsurf

      若收購成功,OpenAI 將直接與在快速發(fā)展的 AI 編碼領域提供服務的 Anthropic、微軟旗下的 GitHub、Anyscale 等公司展開競爭……

    • 小米首款NAS被曝第三季度發(fā)布:雙盤位、ARM架構(gòu)你會買嗎

      快科技4月20日消息,日前,抖音博主老張是大佬”在其作品評論區(qū)曝光了小米NAS發(fā)布時間。針對網(wǎng)友提出的小米NAS什么時候發(fā)布、是否會帶Docker問題,該博主透露,小米NAS將在第三季度發(fā)布,采用ARM架構(gòu)(博主寫的atm架構(gòu),應該是輸錯了),理論會有Docker。據(jù)了解,今年1月,小米生態(tài)鏈總經(jīng)理陳波在直播時透露了小米NAS最新進展,稱目前已進入到開發(fā)的尾聲,逐漸要轉(zhuǎn)入到制?

    • 國際知名半導體研究機構(gòu)SemiAnalysis稱:華為云CloudMatrix 384領先英偉達和AMD的產(chǎn)品一代

      近日,國際知名半導體研究和咨詢機構(gòu)SemiAnalysis發(fā)布專題報道稱,華為云最新推出的AI算力集群解決方案CloudMatrix 384(以下簡稱CM384)憑借其顛覆性的系統(tǒng)架構(gòu)設計與全棧技術創(chuàng)新,在多項關鍵指標上實現(xiàn)對英偉達旗艦產(chǎn)品GB200 NVL72的超越,標志著中國在人工智能基礎設施領域?qū)崿F(xiàn)里程碑式突破。(圖片引自SemiAnalysis報道)據(jù)SemiAnalysis披露,華為云CM384基于384顆昇騰芯片構(gòu)建,通

    • 斥資36億!OpenAI考慮收購前蘋果設計師AI初創(chuàng)公司

      據(jù)報道,OpenAI近期正就收購AI硬件初創(chuàng)公司ioProducts展開深入談判,這筆潛在交易或?qū)⒅厮苋斯ぶ悄苡布袌龈窬帧penAI高層曾考慮以至少5億美元的價格收購這家由OpenAICEO薩姆阿爾特曼與前蘋果傳奇設計師喬納森艾維聯(lián)合創(chuàng)立的公司。這筆交易或?qū)㈤_啟AI巨頭與頂尖工業(yè)設計團隊強強聯(lián)合的新模式,為人工智能技術的終端落地開辟全新路徑。

    • AMD在中國逆襲!Q1市占率已逼近50%

      隨著AMD新一代CPU的推出,AMD在全球市場,尤其是中國市場,逐漸展現(xiàn)出強大的競爭力。AMD平臺的CPU、主板、顯卡等產(chǎn)品,在全球主力戰(zhàn)場大陸市場,正在迎來逆轉(zhuǎn)之勢。英特爾的14代酷睿系列也出現(xiàn)了CPU穩(wěn)定性問題,導致大量CPU需要維修,這進一步促使消費者轉(zhuǎn)向AMD的產(chǎn)品。

    • 卡薩帝超越家電,成為高端AI生活架構(gòu)

      今年的AWE透露出家電行業(yè)的新方向,那就是AI與家電全面融合。很多品牌都在單品家電中加入AI功能,比如,語音控制家電。選擇卡薩帝,即是擁抱一種“被科技深度理解”的生活方式,這也讓卡薩帝品牌得到了巨大的升華,在高端家電市場上建立更深的護城河。