我們現(xiàn)在所處的不是AI時(shí)代,而是一個(gè)生成式AI時(shí)代。
是的,正如黃仁勛在臺(tái)北電腦展2024展前演講中所說,生成式AI技術(shù)正在不知不覺中影響著我們的生活與工作。而早在2014年就提出CUDA(通用計(jì)算平臺(tái))概念的英偉達(dá),已經(jīng)嘗到人工智能帶給它的甜頭。
市值從1萬億美元到2.7萬億美元,英偉達(dá)僅僅用了一年左右的時(shí)間。從紙面數(shù)據(jù)來看,英偉達(dá)毫無疑問是這場(chǎng)AI革命的最大贏家,并且它還在這條道路上不斷前行。
6月2日晚,Computex2024(2024臺(tái)北國(guó)際電腦展)在臺(tái)北貿(mào)易中心南港展覽館正式舉行,英偉達(dá)創(chuàng)始人和CEO黃仁勛登臺(tái)發(fā)表了主題為“Don't Walk”的主題演講,向全球系統(tǒng)且全面的展示了英偉達(dá)在加速計(jì)算和生成式AI的最近成果,同時(shí)分享了人工智能時(shí)代如何助推全球新產(chǎn)業(yè)革命。
在這場(chǎng)兩個(gè)小時(shí)的演講中,黃仁勛宣布“全球最強(qiáng)大的芯片”Blackwell芯片正式投產(chǎn),并表示將在2025年推出Blackwell Ultra AI芯片,2026年發(fā)布下一代全新架構(gòu)Rubin,2027年繼續(xù)推出升級(jí)版Rubin Ultra,以及英偉達(dá)在GPU、CUDA、NIM等不同階段的產(chǎn)品線歷史。
老黃這一套連招下來,相信不少人已經(jīng)被龐大的信息量砸得暈暈乎乎,那么英偉達(dá)即將給AI產(chǎn)業(yè)帶來什么改變?一起來看看。
一年一更,英偉達(dá)GPU架構(gòu)加速迭代
英特爾和英偉達(dá)在不少領(lǐng)域面臨競(jìng)爭(zhēng)關(guān)系,英特爾CEO帕特·基辛格不止一次在公開場(chǎng)合發(fā)表過自己對(duì)英偉達(dá)的看法,在某次采訪中,基辛格感嘆英偉達(dá)在人工智能領(lǐng)域“非常幸運(yùn)”地占據(jù)了主導(dǎo)地位,并表示英偉達(dá)的“地位”本應(yīng)該屬于英特爾。
英偉達(dá)在人工智能領(lǐng)域的主導(dǎo)地位究竟是不是運(yùn)氣使然?這次黃仁勛公布的新架構(gòu)路線圖或許正是最好的回應(yīng)。
由英特爾創(chuàng)始人之一戈登·摩爾提出的摩爾定律,其核心內(nèi)容為處理器性能大約每?jī)赡攴槐?,同時(shí)價(jià)格下降為之前的一半。而英偉達(dá)直接將GPU架構(gòu)的更新頻率從兩年一次更新,加速到一年一次。咱就先不說成本的事,就這更新頻率,大有掀翻摩爾定律的勢(shì)頭。當(dāng)然,從7nm制程開始,一直有人說“摩爾定律已死”,最典型的就是英偉達(dá)CEO黃仁勛,英偉達(dá)能否給這個(gè)討論定下結(jié)論,讓我們共同期待。
圖源:Computex2024
回到產(chǎn)品本身,Blackwell B200是NVIDIABlackwell架構(gòu)首款新產(chǎn)品,基于臺(tái)積電的4nm工藝打造,采用了將兩個(gè)Die連接成一個(gè)GPU的雙芯設(shè)計(jì),因此每個(gè)GPU芯片上擁有2080億個(gè)晶體管,比起上一代GH100GPU上的800億個(gè)晶體管,Blackwell B200GPU算是一次相當(dāng)大的突破。
在B200的基礎(chǔ)上,英偉達(dá)還推出了由兩個(gè)BlackwellB200GPU和一個(gè)基于Arm的Grace CPU組成的完全體AI芯片組:Blackwell GB200。該架構(gòu)主要是為了滿足未來AI工作負(fù)載的需求,為全球機(jī)構(gòu)運(yùn)行實(shí)時(shí)生成式AI提供了可能,而且其成本和能耗只有上一代Hopper GPU架構(gòu)的二十五分之一。
雖然黃仁勛沒有透露2025年計(jì)劃推出Blackwell Ultra的具體情況,但參考Blackwell在性能、成本和能耗方面的提升,同架構(gòu)升級(jí)版本的表現(xiàn)讓人無比期待。
來到2026年,命名源于美國(guó)女天文學(xué)家Vera Rubin的下一代GPU架構(gòu)Rubin即將面世,將首次支持8層HBM4高帶寬存儲(chǔ)。屆時(shí)代號(hào)“Vera”的CPU將于Rubin GPU一同推出,組成Vera Rubin芯片。此外,Rubin平臺(tái)還將搭載新一代NVLink6Switch,提供3600GB/s的連接速度,以及1600GB/s的CX9SuperNIC,以保證高效的數(shù)據(jù)傳輸。
根據(jù)爆料,Rubin架構(gòu)首款產(chǎn)品為R100,采用臺(tái)積電3nm EUV制造工藝,四重曝光技術(shù),CoWoS-L封裝,預(yù)計(jì)2025年第四季度投產(chǎn)。
2027年,升級(jí)版“Rubin Ultra”,HBM4內(nèi)存升級(jí)為12堆棧,容量更大,性能更高。
至此,英偉達(dá)未來4年的宏偉藍(lán)圖正式向我們展開,這一戰(zhàn)略規(guī)劃一直延伸到2027年,英偉達(dá)提前公布的方式盡顯自信。自信來源于底氣,黃仁勛在演講中直接將英偉達(dá)定義為全球生成式AI浪潮的來源及推動(dòng)者:
人工智能崛起之所以有可能,完全因?yàn)槲覀兿嘈胖灰審?qiáng)大的計(jì)算變得越來越便宜,總會(huì)有人找到巨大的用途。正因?yàn)槲覀兝锰囟ㄋ惴▽⒂?jì)算邊際成本降低了100萬級(jí)別,今天使用互聯(lián)網(wǎng)上的所有數(shù)據(jù)來訓(xùn)練大模型才成為了所有人默認(rèn)合乎邏輯的選擇,不再有人懷疑和質(zhì)疑這個(gè)做法。而在英偉達(dá)這么做之前,沒有人預(yù)料到,沒有人提出這樣的需求,甚至沒有人理解全部潛力。
我們很難評(píng)判這番言論的對(duì)錯(cuò),但英偉達(dá)對(duì)全球生成式AI產(chǎn)業(yè)的貢獻(xiàn)大家有目共睹,其主張的CUDA已經(jīng)達(dá)到了相對(duì)成熟階段,隨著CPU性能增長(zhǎng)放緩,利用CUDA等技術(shù)加速計(jì)算任務(wù)又將成為應(yīng)對(duì)計(jì)算需求的新寵兒,生成式AI也將成為全球下一次革命性的技術(shù)變革。
英偉達(dá)還有什么護(hù)城河?
在演講中,黃仁勛還介紹了Earth-2數(shù)字孿生地球、Isaac機(jī)器人平臺(tái)、nference Microservices等一系列AI工廠的內(nèi)容。隨著業(yè)務(wù)的不斷擴(kuò)展,我們似乎很難用一個(gè)或幾個(gè)詞來概括這家萬億市值級(jí)別的芯片巨頭了。
過去提起英偉達(dá)的優(yōu)勢(shì),大家最熟悉的必然是GPU、CUDA......,大體可以歸納為軟件構(gòu)建生態(tài),硬件堆砌算力。說到這里,又要請(qǐng)出老熟人英特爾CEO帕特·基辛格,因?yàn)樗诳犷ltra發(fā)布會(huì)上表示:英偉達(dá)CUDA護(hù)城河又小又淺。
來到生成式AI時(shí)代,如果CUDA真如基辛格所說,無法成為英偉達(dá)的技術(shù)護(hù)城河,那么英偉達(dá)還能依靠什么呢?我想答案或許是AI網(wǎng)絡(luò)。
去年5月,英偉達(dá)在COMPUTEX2023上發(fā)布了全球首個(gè)專為人工智能(AI)設(shè)計(jì)的高性能以太網(wǎng)架構(gòu)Spectrum-X,其主要面向生成式AI市場(chǎng)。據(jù)介紹,Spectrum-X擁有無損網(wǎng)絡(luò)、動(dòng)態(tài)路由、流量擁塞控制、多業(yè)務(wù)性能隔離等主要特性,能降低大模型訓(xùn)練成本、縮短訓(xùn)練時(shí)間。
圖源:英偉達(dá)
AI大模型之所以稱之為大,不僅是因?yàn)槟P蛥?shù)量大,還有日常訓(xùn)練所需的龐大數(shù)據(jù),這些先決條件導(dǎo)致大模型的訓(xùn)練成本極高。
4月初,OpenAI的競(jìng)爭(zhēng)對(duì)手Anthropic的首席執(zhí)行官達(dá)里奧·阿莫代伊接受采訪時(shí)指出,目前市場(chǎng)上人工智能模型的培訓(xùn)成本已高達(dá)約1億美元,預(yù)計(jì)到了2025年和2026年,這一成本將飆升至50億或100億美元。
其中的大部分費(fèi)用被GPU消耗,以英偉達(dá)Blackwell處理器為例,訓(xùn)練一個(gè)擁有1.8萬億參數(shù)的AI大模型需要大約2000個(gè)BlackwellGPU,如果將GPU換成Hopper,則大約需要8000個(gè)。
因此,不少企業(yè)選擇打造成千上萬GPU互聯(lián)的AI數(shù)據(jù)中心,其實(shí)也就是黃仁勛所說的AI工廠,只不過這個(gè)工廠生產(chǎn)的產(chǎn)品是訓(xùn)練好的大模型。整體算力優(yōu)勢(shì)能有效降低訓(xùn)練成本,減輕企業(yè)從頭搭建AI大模型的復(fù)雜步驟,簡(jiǎn)單來說,就是AI大模型訓(xùn)練外包。
除了AI數(shù)據(jù)中心外,另一個(gè)方法就是前面提到的網(wǎng)絡(luò)架構(gòu)。區(qū)別于傳統(tǒng)網(wǎng)絡(luò),面向AI計(jì)算的網(wǎng)絡(luò)架構(gòu)就是為了解決單一數(shù)據(jù)中心超載,從而需要多個(gè)地區(qū)的數(shù)據(jù)中心協(xié)同工作而存在的。
圖源:英偉達(dá)
從技術(shù)層面來看,Spectrum-X針對(duì)AI計(jì)算的高穩(wěn)定性要求,進(jìn)行了針對(duì)性優(yōu)化,也就是多種軟硬件技術(shù)組成的系統(tǒng)級(jí)網(wǎng)絡(luò)架構(gòu),以解決AI訓(xùn)練過程中N個(gè)GPU同步運(yùn)行的負(fù)載,以及處理突發(fā)流量的能力。
隨著生成式AI的發(fā)展,數(shù)據(jù)量需求必然劇增,當(dāng)純GPU和單一數(shù)據(jù)中心不足以解決數(shù)據(jù)負(fù)載問題時(shí),成熟的網(wǎng)絡(luò)架構(gòu)就會(huì)成為英偉達(dá)下個(gè)技術(shù)護(hù)城河?;蛟S英偉達(dá)在布局時(shí)也沒有想到,這個(gè)原本用于傳統(tǒng)云計(jì)算的技術(shù)會(huì)成為生成式AI浪潮的關(guān)鍵。
寫在最后
英偉達(dá)公布的截至2024年4月28日的2025財(cái)年第一財(cái)季財(cái)報(bào)顯示,英偉達(dá)期內(nèi)實(shí)現(xiàn)營(yíng)收260.44億美元,同比上漲262%;凈利潤(rùn)148.81億美元,同比上漲628%。財(cái)報(bào)數(shù)據(jù)公布后不久,英偉達(dá)股價(jià)迅速上漲,據(jù)統(tǒng)計(jì),在過去的2023年中,英偉達(dá)股價(jià)漲幅超230%,今年以來漲幅已達(dá)到121.39%。
可以說,全球AI算力芯片龍頭,被稱為“AI時(shí)代賣鏟人”的英偉達(dá)在這輪生成式AI浪潮中賺得盆滿缽滿,也難怪老黃在演講時(shí)春風(fēng)滿面。現(xiàn)在,英偉達(dá)的“卡”供不應(yīng)求,不只是字節(jié)、百度等中國(guó)科技巨頭在搶著囤卡以應(yīng)對(duì)極端情況,硅谷科技巨頭如微軟、Meta,也全都在找英偉達(dá)買卡。
圖源:英偉達(dá)
事實(shí)上,入局AI以及AI芯片的玩家越來越多,OpenAI以及谷歌等AI巨頭也將AI產(chǎn)品的競(jìng)爭(zhēng)方向從大語言模型轉(zhuǎn)向多模態(tài)模型。可以預(yù)見的是,接下來幾年企業(yè)訓(xùn)練AI的算力需求還會(huì)沖上一個(gè)新高峰,英偉達(dá)作為當(dāng)前AI算力芯片領(lǐng)域的巨頭,持續(xù)增長(zhǎng)幾乎是板上釘釘?shù)氖虑椤?/p>
當(dāng)然,谷歌、OpenAI等玩家都在通過自己的方式試圖打破英偉達(dá)的算力霸權(quán),短時(shí)間內(nèi)或許很難實(shí)現(xiàn)抗衡,但市場(chǎng)不會(huì)坐視任何企業(yè)一家獨(dú)大,所有玩家都會(huì)繼續(xù)挑戰(zhàn)英偉達(dá),直至成功。
英偉達(dá)能否再續(xù)輝煌,一年一款大更新帶來的效果究竟會(huì)有多驚人,我們很快就能知道答案。
(舉報(bào))