在2021年英特爾架構(gòu)日上,英特爾公司高級(jí)副總裁兼加速計(jì)算系統(tǒng)和圖形事業(yè)部總經(jīng)理Raja Koduri宣布,英特爾在高性能計(jì)算領(lǐng)域?qū)崿F(xiàn)了三大突破。
“Sapphire Rapids和Ponte Vecchio都是超異構(gòu)計(jì)算的芯片,采用了不同的處理架構(gòu)設(shè)計(jì),Sapphire Rapids里面核的種類沒(méi)有Ponte Vecchio多,相對(duì)簡(jiǎn)單一些,聚焦服務(wù)器和云計(jì)算領(lǐng)域的計(jì)算需求,采用45微米制程,EMIB的封裝集成就可以;Ponte Vecchio更加激進(jìn),面對(duì)高端的超算中心,這個(gè)領(lǐng)域?qū)τ谛酒?、延遲、計(jì)算能力要求很高,集成度就更高,基于臺(tái)積電先進(jìn)的N5制程工藝技術(shù),設(shè)計(jì)均被集成于Foveros封裝中,為提高功率和互連密度形成有源芯片的3D堆疊。我們和其他競(jìng)爭(zhēng)對(duì)手的差別,主要在于我們有不同的技術(shù)架構(gòu)應(yīng)對(duì)不同的需求。” 英特爾中國(guó)研究院副總裁、英特爾中國(guó)研究院院長(zhǎng)宋繼強(qiáng)解釋了高性能計(jì)算領(lǐng)域,英特爾兩款主要產(chǎn)品的技術(shù)優(yōu)勢(shì)和路線。
Sapphire Rapids:它結(jié)合了英特爾的性能核與全新加速器引擎,樹(shù)立了下一代數(shù)據(jù)中心處理器的標(biāo)準(zhǔn)。Sapphire Rapids的核心是一個(gè)模塊化的分區(qū)SoC架構(gòu),得益于英特爾的EMIB多晶片互連封裝技術(shù)和先進(jìn)網(wǎng)格架構(gòu),它具有顯著的可擴(kuò)展性,同時(shí)仍保持單晶片CPU接口的優(yōu)勢(shì)。
Sapphire Rapids的核心是一個(gè)分區(qū)塊、模塊化的SoC架構(gòu),采用英特爾的嵌入式多芯片互連橋接(EMIB)封裝技術(shù),在保持單晶片CPU接口優(yōu)勢(shì)的同時(shí),具有顯著的可擴(kuò)展性。Sapphire Rapids提供了一個(gè)單一、平衡的統(tǒng)一內(nèi)存訪問(wèn)架構(gòu),每個(gè)線程均可完全訪問(wèn)緩存、內(nèi)存和I/O等所有單元上的全部資源,由此實(shí)現(xiàn)整個(gè)SoC具有一致的低時(shí)延和高橫向帶寬。
Sapphire Rapids基于Intel 7制程工藝技術(shù),采用英特爾全新的性能核微架構(gòu),該架構(gòu)旨在提高速度,突破低時(shí)延和單線程應(yīng)用性能的極限。
基礎(chǔ)設(shè)施處理器(IPU):Mount Evans是英特爾首款專用ASIC IPU,以及全新的基于FPGA的IPU參考平臺(tái)——Oak Springs Canyon。通過(guò)基于英特爾IPU的架構(gòu),云服務(wù)提供商(CSPs)可以通過(guò)把基礎(chǔ)設(shè)施任務(wù)從CPU轉(zhuǎn)移到IPU,從而讓數(shù)據(jù)中心收益更大化。把基礎(chǔ)設(shè)施任務(wù)轉(zhuǎn)移到IPU,能夠讓云服務(wù)提供商(CSPs)可以把所有的服務(wù)器CPU租給客戶。
Ponte Vecchio基于Xe HPC微架構(gòu),提供業(yè)界領(lǐng)先的每秒浮點(diǎn)運(yùn)算次數(shù)(FLOPs)和計(jì)算密度,以加速AI、HPC和高級(jí)分析工作負(fù)載。它是基于Intel 7制程工藝的大型芯片,針對(duì)Foveros技術(shù)進(jìn)行了優(yōu)化。
Ponte Vecchio是英特爾迄今為止最復(fù)雜的SoC,也是我們踐行IDM 2.0戰(zhàn)略的絕佳示例,它采用多種先進(jìn)的半導(dǎo)體制程工藝、英特爾變革性的EMIB技術(shù)以及Foveros 3D封裝技術(shù)。這是我們實(shí)現(xiàn)堪比登月難度創(chuàng)新后的一款產(chǎn)品,它包含1000億個(gè)晶體管,提供業(yè)界領(lǐng)先的浮點(diǎn)運(yùn)算和計(jì)算密度,以加速人工智能、高性能計(jì)算和高級(jí)分析工作負(fù)載。在架構(gòu)日上,英特爾展示了早期的Ponte Vecchio芯片就已經(jīng)顯示出領(lǐng)先的性能,在一個(gè)流行的AI基準(zhǔn)測(cè)試上創(chuàng)造了推理和訓(xùn)練吞吐量的行業(yè)紀(jì)錄。
英特爾的A0芯片已經(jīng)實(shí)現(xiàn)了超過(guò)每秒45萬(wàn)億次浮點(diǎn)運(yùn)算的FP32吞吐量,超過(guò)5 TBps的持續(xù)內(nèi)存結(jié)構(gòu)帶寬以及超過(guò) 2 TBps的連接帶寬。如Xe架構(gòu)一樣,Ponte Vecchio將由oneAPI支持,后者是英特爾一個(gè)開(kāi)放、基于標(biāo)準(zhǔn)、跨架構(gòu)、跨供應(yīng)商的統(tǒng)一軟件堆棧。
自從2020年12月發(fā)布第一個(gè)版本以來(lái),超過(guò)20萬(wàn)名開(kāi)發(fā)者在獲得Xe HPC之前就已經(jīng)安裝了英特爾的oneAPI產(chǎn)品。多個(gè)領(lǐng)域的獨(dú)立軟件開(kāi)發(fā)商已經(jīng)推出了超過(guò)300個(gè)采用oneAPI統(tǒng)一編程模型的應(yīng)用軟件。而且,英特爾有80多個(gè)支持Xe HPC的關(guān)鍵HPC應(yīng)用軟件、AI框架和中間件,它們利用oneAPI快速移植當(dāng)前基于CPU或CUDA的GPU實(shí)施。
回望過(guò)去一年,科技處于所有人如何溝通、工作、娛樂(lè)和應(yīng)對(duì)新冠肺炎疫情的核心。事實(shí)證明,強(qiáng)大的計(jì)算能力至關(guān)重要。展望未來(lái),我們面臨龐大的算力需求,預(yù)計(jì)到2025年將是1000x(千倍級(jí))的提升,而四年內(nèi)增加1,000倍相當(dāng)于摩爾定律的5次方。
英特爾CEO帕特·基辛格也是一位架構(gòu)師,他說(shuō):“我們面臨艱巨的計(jì)算挑戰(zhàn),一定要通過(guò)變革性的架構(gòu)和平臺(tái)來(lái)解決……正是英特爾才華橫溢的架構(gòu)師和工程師們,讓這些技術(shù)‘魔法’得以成真。”
本文為原創(chuàng)文章,作者章鷹,微信號(hào)zy1052625525,轉(zhuǎn)載請(qǐng)注明以上來(lái)源。如需入群交流,請(qǐng)?zhí)砑游⑿舉lecfans999,投稿發(fā)郵件到huangjingjing@elecfans.com.