盡管在日常生活中,大多數(shù)普通用戶都接觸不到服務(wù)器和數(shù)據(jù)中心平臺(tái),但是一方面,我們使用的很多軟件和互聯(lián)網(wǎng)服務(wù),背后就是數(shù)據(jù)中心在默默提供支撐,另一方面,大量先進(jìn)的計(jì)算技術(shù)都首先應(yīng)用于數(shù)據(jù)中心,并惠及消費(fèi)級(jí)平臺(tái)。
所以,數(shù)據(jù)中心看似遙遠(yuǎn),其實(shí)就在我們身邊。
今年1月11日,英特爾正式發(fā)布了代號(hào)Sapphire Rapids的第四代至強(qiáng)可擴(kuò)展處理器(下文簡(jiǎn)稱四代至強(qiáng)),還有集成HBM高帶寬內(nèi)存的至強(qiáng)Max系列,以及代號(hào)Ponte Vecchio的數(shù)據(jù)中心GPU Max系列。
雖然乍一看,四代至強(qiáng)的有些規(guī)格不如競(jìng)品,但事實(shí)上,英特爾現(xiàn)在追求的,已經(jīng)不再是單一產(chǎn)品參數(shù),而是打造更強(qiáng)大、更靈活、更適應(yīng)未來的綜合算力平臺(tái)。
英特爾市場(chǎng)營(yíng)銷集團(tuán)副總裁、中國(guó)區(qū)數(shù)據(jù)中心銷售總經(jīng)理兼中國(guó)區(qū)運(yùn)營(yíng)商銷售總經(jīng)理莊秉翰指出,雖然傳統(tǒng)上都認(rèn)為Intel是一家CPU處理器公司,但在多元化的數(shù)字和數(shù)據(jù)時(shí)代,Intel提出了全新的XPU”戰(zhàn)略,通過提供CPU、GPU、FPGA、IPU等多種異構(gòu)產(chǎn)品,為不同業(yè)務(wù)、應(yīng)用場(chǎng)景提供定制化的算力解決方案。
除了硬件,Intel的軟實(shí)力也不容小覷,旗下有著規(guī)模龐大的軟件團(tuán)隊(duì)和研究院,畢竟,強(qiáng)大的軟件是充分釋放硬件潛力的關(guān)鍵。
尤其是在開源方面,英特爾一向毫不吝嗇,為開源生態(tài)和社區(qū)貢獻(xiàn)了大量的軟件架構(gòu),這也有利于推動(dòng)英特爾產(chǎn)品的應(yīng)用和生態(tài)的擴(kuò)展。
四代至強(qiáng)不僅擁有Intel 7先進(jìn)工藝、全新架構(gòu),以及業(yè)界領(lǐng)先的DDR5、PCIe 5.0、CXL 1.1,更是在加速器方面引領(lǐng)了新潮流。
四代至強(qiáng)發(fā)布的時(shí)候,Intel強(qiáng)調(diào)它具備七大神器”,包括高級(jí)矩陣擴(kuò)展(AMX)、動(dòng)態(tài)負(fù)載均衡器(DLB)、數(shù)據(jù)流加速器(DSA)、存內(nèi)分析加速器(IAA)、數(shù)據(jù)保護(hù)與壓縮加速技術(shù)(QAT)、安全引擎(Security)、至強(qiáng)Max高帶寬內(nèi)存(HBM)。
這些加速器不會(huì)改變已有的算法,仍是對(duì)算法的計(jì)算進(jìn)行加速,從而提高效率、節(jié)約時(shí)間,也讓客戶進(jìn)一步可以去設(shè)計(jì)新的算法。
根據(jù)官方數(shù)據(jù),四代至強(qiáng)通過內(nèi)置的豐富加速器,相比上代產(chǎn)品將目標(biāo)工作負(fù)載的平均能效(每瓦性能)提升了多達(dá)2.9倍,而在優(yōu)化電源模式下,每顆處理器可以節(jié)能高達(dá)70瓦且性能的影響極低,總體擁有成本也降低52-66%。
具體應(yīng)用實(shí)例方面,比如騰訊借助AMX提升搜索、視頻業(yè)務(wù)效率;比如京東利用IAA、DSA將天樞服務(wù)器性能提升超過1.7倍;比如阿里云第八代ESC實(shí)例整體算力提升60%、數(shù)據(jù)庫(kù)讀寫性能提升15%、加解密和壓縮解壓性能提升4倍、AI推理性能提升4倍;比如火山引擎第三代彈性計(jì)算實(shí)例整機(jī)算力、單核算力、網(wǎng)絡(luò)轉(zhuǎn)發(fā)、存儲(chǔ)IOPS、加解密、AI推理加速等全面明顯提升
英特爾技術(shù)專家也分享了四代至強(qiáng)加速器在多個(gè)具體應(yīng)用場(chǎng)景中的體現(xiàn):
- 阿里的地址標(biāo)準(zhǔn)化”服務(wù)(如淘寶收貨地址定位),使用AMX INT8加速和軟件優(yōu)化,單位時(shí)間查詢性能提升2.48倍。
- 淘寶APP首頁(yè)定制化推薦服務(wù),使用AMX BF16、軟件優(yōu)化、AVX-512調(diào)優(yōu),性能提升3倍。
- 部署于騰訊云上的太極機(jī)器學(xué)習(xí)平臺(tái)支撐的搜索和廣告業(yè)務(wù),使用AMX BF16/INT8,高精度實(shí)例性能提升3倍,低精度實(shí)例性能提升2倍,云服務(wù)實(shí)例所需CPU數(shù)量也大大減少。
- Stable Diffusion注意力機(jī)制,使用AMX BF16加速矩陣計(jì)算,使用AVX-512加速指數(shù)計(jì)算,搭配PyTorch插件,吞吐性能提升3.82倍。
- 亞信電信營(yíng)業(yè)廳OCR方案,使用AMX軟硬件優(yōu)化,性能提升3.94倍。
- 用友企業(yè)ERP OCR服務(wù)使用AMX BF16/INT8加速,性能提升2.83倍。
- Clickhouse大數(shù)據(jù)分析數(shù)據(jù)庫(kù),使用IAA,Q4.1壓縮解壓性能提升40%。
- MongoDB數(shù)據(jù)庫(kù),使用IAA,性能提升47%。
- DML、DPDK、SPDK等軟件庫(kù),均已集成DSA,性能可提升2.25倍,CPU資源可節(jié)省66%。
- 微軟SQL Server,使用QAT加速,備份時(shí)間可縮短2/3,性能可提升1.34倍。
- Gbase 8a并行數(shù)據(jù)庫(kù),使用IAA,ZSTD壓縮算法性能提升1.84倍,RapidZ壓縮算法性能提升1.66倍。
四代至強(qiáng)發(fā)布之后,英特爾又加推了vRAN Boost,完全集成物理層加速功能,不再需要獨(dú)立的加速卡,成為四代至強(qiáng)的新神器”。
使用這一加速器,運(yùn)營(yíng)商可以在通用虛擬化平臺(tái)上整合所有基站層,從而以通用處理器實(shí)現(xiàn)基站功能。
與上一代相比,vRAN Boost加速器能夠在不增加功耗的情況下,提供兩倍的容量,同時(shí)節(jié)省多達(dá)20%的能耗,滿足關(guān)鍵的性能、擴(kuò)展和能效要求。
英特爾技術(shù)專家指出,CPU處理器的發(fā)展趨勢(shì)曾經(jīng)就是單純地提高頻率、增加核心數(shù)量,但是對(duì)于互聯(lián)網(wǎng)客戶來說,特殊需求越來越多,比如壓縮解壓、加解密等等,更多核心、更高頻率不一定能帶來足夠高的效率提升,提供一個(gè)專用加速器反而會(huì)有奇效,它相比異構(gòu)計(jì)算距離內(nèi)存也更近。
同時(shí),隨著客戶和行業(yè)越來越重視能效,加速器也是提升能效比的有效途徑。
當(dāng)然,集成加速器會(huì)增加處理器的設(shè)計(jì)難度,影響驗(yàn)證上市時(shí)間,也會(huì)增加生態(tài)適配的難度,而這就體現(xiàn)了英特爾強(qiáng)大的業(yè)界影響力和號(hào)召力,可以推動(dòng)生態(tài)支持,保證產(chǎn)品上市的時(shí)候就有大量軟件服務(wù)可以支持到位。
值得一提的是,并不是每家客戶都需要那么多的加速器,因此英特爾還提供了全新的On Demand服務(wù),客戶可以根據(jù)自己的實(shí)際需要,靈活選購(gòu)不同的加速器,也可以按照使用量來開關(guān)付費(fèi)。
莊秉翰還指出,隨著雙碳”、新基建、東數(shù)西算”的推進(jìn),對(duì)未來數(shù)據(jù)中心能耗的需求越來越嚴(yán)苛,綠色計(jì)算成為可持續(xù)發(fā)展的關(guān)鍵動(dòng)力。
四代至強(qiáng)集成的眾多加速器,能夠以更高效率、更低能耗處理這種需求越來越大、越來越復(fù)雜的工作負(fù)載,換言之就是用更少能源消耗的完成更多的工作,同時(shí)還有一系列新的電源管理方案輔佐,進(jìn)一步提高能效。
在制造過程中,Intel使用的電力已經(jīng)超過90%都是可再生能源,并且三代、四代至強(qiáng)提供一年的浸沒式液冷方案保修服務(wù),這在業(yè)界還是唯一一家。
如此種種,都讓四代至強(qiáng)成為最具可持續(xù)性的數(shù)據(jù)中心處理器。
英特爾至強(qiáng)可擴(kuò)展處理器誕生于2017年,迄今已經(jīng)累計(jì)交付超過8500萬顆,其中第三代產(chǎn)品在過去兩年就出貨了1500萬顆。
最新的第四代產(chǎn)品已經(jīng)完成了400多款不同設(shè)計(jì)方案,200多款已出貨,前十大云服務(wù)提供商都會(huì)在今年部署基于新至強(qiáng)的云實(shí)例。
面向未來,隨著算力市場(chǎng)需求的提高、應(yīng)用的拓展,英特爾也在有針對(duì)性地開發(fā)新產(chǎn)品,都在順利推進(jìn)中。
比如2023年內(nèi)推出下一代Emerald Rapids,2024年開始更是迎來全新變革,基于性能核的Granite Rapids、基于能效核的Sierra Forest,都會(huì)升級(jí)到Intel 3制造工藝,并集成更多核心,對(duì)于微服務(wù)、容器化場(chǎng)景非常適合。
總的來說,英特爾至強(qiáng)可擴(kuò)展平臺(tái)已經(jīng)跳出來單純拼參數(shù)的傳統(tǒng)巢窠,進(jìn)入了全新的加速器時(shí)代,通過針對(duì)特定負(fù)載和應(yīng)用需求進(jìn)行加速,以更靈活的方式、更低的能效實(shí)現(xiàn)更高的效率,更適應(yīng)多元化的新算力時(shí)代。
如此,新至強(qiáng)既為客戶實(shí)現(xiàn)更高的經(jīng)濟(jì)效益,又符合節(jié)能減排、綠色可持續(xù)發(fā)展的全球趨勢(shì),也讓我們對(duì)至強(qiáng)可擴(kuò)展平臺(tái)未來的發(fā)展,有了更高的期待。
(舉報(bào))