在2021年英特爾架構日上,英特爾公司高級副總裁兼加速計算系統(tǒng)和圖形事業(yè)部總經理Raja Koduri宣布,英特爾在高性能計算領域實現(xiàn)了三大突破。
“Sapphire Rapids是我們的下一代至強可擴展處理器。它能夠提供卓越的開箱即用的性能,為數(shù)據(jù)中心內廣泛的工作負載和部署模式帶來增強功能。” 英特爾首席數(shù)據(jù)中心架構師Sailesh表示,“Sapphire Rapids的基本架構旨在實現(xiàn)彈性計算模型(如容器化微服務)的突破性性能,以及在所有形式的以數(shù)據(jù)為中心的計算中快速擴展 AI 的使用。此外,Sapphire Rapids還提升了最先進的內存和I/O技術?!?/strong>
“Sapphire Rapids和Ponte Vecchio都是超異構計算的芯片,采用了不同的處理架構設計,Sapphire Rapids里面核的種類沒有Ponte Vecchio多,相對簡單一些,聚焦服務器和云計算領域的計算需求,采用45微米制程,EMIB的封裝集成就可以;Ponte Vecchio更加激進,面對高端的超算中心,這個領域對于芯片功耗、延遲、計算能力要求很高,集成度就更高,基于臺積電先進的N5制程工藝技術,設計均被集成于Foveros封裝中,為提高功率和互連密度形成有源芯片的3D堆疊。我們和其他競爭對手的差別,主要在于我們有不同的技術架構應對不同的需求?!?英特爾中國研究院副總裁、英特爾中國研究院院長宋繼強解釋了高性能計算領域,英特爾兩款主要產品的技術優(yōu)勢和路線。
Sapphire Rapids:它結合了英特爾的性能核與全新加速器引擎,樹立了下一代數(shù)據(jù)中心處理器的標準。Sapphire Rapids的核心是一個模塊化的分區(qū)SoC架構,得益于英特爾的EMIB多晶片互連封裝技術和先進網格架構,它具有顯著的可擴展性,同時仍保持單晶片CPU接口的優(yōu)勢。
Sapphire Rapids的核心是一個分區(qū)塊、模塊化的SoC架構,采用英特爾的嵌入式多芯片互連橋接(EMIB)封裝技術,在保持單晶片CPU接口優(yōu)勢的同時,具有顯著的可擴展性。Sapphire Rapids提供了一個單一、平衡的統(tǒng)一內存訪問架構,每個線程均可完全訪問緩存、內存和I/O等所有單元上的全部資源,由此實現(xiàn)整個SoC具有一致的低時延和高橫向帶寬。
Sapphire Rapids基于Intel 7制程工藝技術,采用英特爾全新的性能核微架構,該架構旨在提高速度,突破低時延和單線程應用性能的極限。
基礎設施處理器(IPU):Mount Evans是英特爾首款專用ASIC IPU,以及全新的基于FPGA的IPU參考平臺——Oak Springs Canyon。通過基于英特爾IPU的架構,云服務提供商(CSPs)可以通過把基礎設施任務從CPU轉移到IPU,從而讓數(shù)據(jù)中心收益更大化。把基礎設施任務轉移到IPU,能夠讓云服務提供商(CSPs)可以把所有的服務器CPU租給客戶。
Ponte Vecchio基于Xe HPC微架構,提供業(yè)界領先的每秒浮點運算次數(shù)(FLOPs)和計算密度,以加速AI、HPC和高級分析工作負載。它是基于Intel 7制程工藝的大型芯片,針對Foveros技術進行了優(yōu)化。
Ponte Vecchio是英特爾迄今為止最復雜的SoC,也是我們踐行IDM 2.0戰(zhàn)略的絕佳示例,它采用多種先進的半導體制程工藝、英特爾變革性的EMIB技術以及Foveros 3D封裝技術。這是我們實現(xiàn)堪比登月難度創(chuàng)新后的一款產品,它包含1000億個晶體管,提供業(yè)界領先的浮點運算和計算密度,以加速人工智能、高性能計算和高級分析工作負載。在架構日上,英特爾展示了早期的Ponte Vecchio芯片就已經顯示出領先的性能,在一個流行的AI基準測試上創(chuàng)造了推理和訓練吞吐量的行業(yè)紀錄。
英特爾的A0芯片已經實現(xiàn)了超過每秒45萬億次浮點運算的FP32吞吐量,超過5 TBps的持續(xù)內存結構帶寬以及超過 2 TBps的連接帶寬。如Xe架構一樣,Ponte Vecchio將由oneAPI支持,后者是英特爾一個開放、基于標準、跨架構、跨供應商的統(tǒng)一軟件堆棧。
自從2020年12月發(fā)布第一個版本以來,超過20萬名開發(fā)者在獲得Xe HPC之前就已經安裝了英特爾的oneAPI產品。多個領域的獨立軟件開發(fā)商已經推出了超過300個采用oneAPI統(tǒng)一編程模型的應用軟件。而且,英特爾有80多個支持Xe HPC的關鍵HPC應用軟件、AI框架和中間件,它們利用oneAPI快速移植當前基于CPU或CUDA的GPU實施。
回望過去一年,科技處于所有人如何溝通、工作、娛樂和應對新冠肺炎疫情的核心。事實證明,強大的計算能力至關重要。展望未來,我們面臨龐大的算力需求,預計到2025年將是1000x(千倍級)的提升,而四年內增加1,000倍相當于摩爾定律的5次方。
英特爾CEO帕特·基辛格也是一位架構師,他說:“我們面臨艱巨的計算挑戰(zhàn),一定要通過變革性的架構和平臺來解決……正是英特爾才華橫溢的架構師和工程師們,讓這些技術‘魔法’得以成真?!?br />
本文為原創(chuàng)文章,作者章鷹,微信號zy1052625525,轉載請注明以上來源。如需入群交流,請?zhí)砑游⑿舉lecfans999,投稿發(fā)郵件到huangjingjing@elecfans.com.
-
英特爾
+關注
關注
61文章
10196瀏覽量
174727 -
臺積電
+關注
關注
44文章
5755瀏覽量
169857 -
超算
+關注
關注
1文章
117瀏覽量
9355
發(fā)布評論請先 登錄
臺積電2nm良率超 90%!蘋果等巨頭搶單
臺積電2nm制程良率已超60%
英特爾至強6:如何煉就數(shù)據(jù)中心“全能型選手”

英特爾18A與臺積電N2工藝各有千秋
博通臺積電或聯(lián)手瓜分英特爾
消息稱臺積電3nm、5nm和CoWoS工藝漲價,即日起效!
臺積電2nm工藝將量產,蘋果iPhone成首批受益者
臺積電產能爆棚:3nm與5nm工藝供不應求
所謂的7nm芯片上沒有一個圖形是7nm的

評論