蘋(píng)果今年的發(fā)布會(huì)三部曲終于落下了帷幕。這場(chǎng)壓軸大戲上,發(fā)布了蘋(píng)果自研芯片Apple Silicon的第一代產(chǎn)品:M1芯片。首批搭載M1芯片的Mac機(jī)器共有三款:MacBook Air、13寸MacBook Pro和MacMini。不管是發(fā)布會(huì)上公布的性能提升,還是這幾天關(guān)于這幾款機(jī)器的實(shí)際評(píng)測(cè)紛紛出爐,M1芯片的性能和功耗完全超出人們預(yù)期,用“顛覆”來(lái)形容也不為過(guò)。
今天的文章就來(lái)聊聊蘋(píng)果的M1芯片。我想從芯片設(shè)計(jì)的角度,和大家一起看看M1芯片為何如此牛逼的三個(gè)主要原因。
芯片設(shè)計(jì)的PPA優(yōu)化
在設(shè)計(jì)芯片的時(shí)候,一個(gè)最重要的原則就是對(duì)PPA的優(yōu)化,也就是盡可能的優(yōu)化芯片的功耗(Power)、性能(Performance)和面積(Area)。通常情況下,這三點(diǎn)不能兼得。
比如,為了提升芯片的性能,我們可以加入多級(jí)流水線、增加總線寬度、或者增加各種硬核處理單元,但此時(shí)就很有可能會(huì)付出更高的功耗、以及更大的芯片面積作為代價(jià)。反之,如果我們想要設(shè)計(jì)低功耗的芯片,那也很有可能需要犧牲一部分芯片的性能。所以在實(shí)際工程實(shí)踐中,功耗、性能和面積往往都是相互折中、互相平衡的關(guān)系。 對(duì)于一個(gè)芯片來(lái)說(shuō),沒(méi)有完美的設(shè)計(jì),只有完美的平衡。 這就像給你有限的預(yù)算去買食材做菜,那就很難既買到魚(yú),又買到熊掌。
但是這次蘋(píng)果M1芯片的發(fā)布,給人最直觀的感受就是,在預(yù)算不變的情況下,你可以魚(yú)和熊掌,兩者兼得。
蘋(píng)果在發(fā)布會(huì)里放出了這張圖,它比較的是M1芯片和某個(gè)筆記本的CPU,但蘋(píng)果沒(méi)說(shuō)是誰(shuí)。為了方便敘述,這里姑且叫它“張三芯片”。在這張圖里,橫軸是功耗,縱軸是性能??梢钥吹?,對(duì)于一個(gè)給定的功耗標(biāo)準(zhǔn),M1的性能是張三的兩倍。對(duì)于一個(gè)給定的性能要求,M1的功耗是張三的四分之一。
也就是說(shuō),在高性能和低功耗這兩個(gè)往往此消彼長(zhǎng)的維度里,M1芯片同時(shí)取得了極大的提升。除了CPU之外,M1里的GPU也取得了類似的性能提升和功耗下降。蘋(píng)果表示,M1有著當(dāng)前世界上最好的CPU每瓦性能,以及當(dāng)前世界上最快的集成顯卡。
在之前的文章 《英特爾11代酷睿TigerLake:全網(wǎng)最犀利點(diǎn)評(píng)》 里說(shuō)過(guò), 不管市場(chǎng)營(yíng)銷用什么話術(shù),跑分永遠(yuǎn)是不可能被繞開(kāi)的一關(guān) 。雖然蘋(píng)果官方?jīng)]說(shuō)跑分的事情,但是各類評(píng)測(cè)已經(jīng)給出了相當(dāng)高的跑分結(jié)果。
從Geekbench的跑分來(lái)看,這次搭載了M1芯片的三款產(chǎn)品,不管單核還是多核,都跑出了相當(dāng)高的分?jǐn)?shù):
Mac Mini: 1682 / 7097
MacBook Air: 1687 / 7433
MacBook Pro: 1714 / 6802
事實(shí)上,它們的單核跑分都超過(guò)了AMD剛剛發(fā)布的銳龍9 5950X,也超過(guò)了英特爾的TigerLake旗艦版,也就是11代酷睿的i7-1165G7。
此外,這三款產(chǎn)品的單核和多核跑分也超過(guò)了目前正在賣的2019款16寸MacBook Pro。也就是說(shuō),單從CPU的跑分來(lái)看,這個(gè)新款的macbook air比蘋(píng)果去年剛剛發(fā)布的旗艦筆記本還要快了。
不僅是性能,搭載M1芯片的筆記本續(xù)航時(shí)間也有了大幅提升,最高可以達(dá)到20小時(shí)。
在我看來(lái),M1芯片取得如此巨大的能效提升,主要有三個(gè)原因: 一個(gè)是使用了5納米工藝,第二個(gè)是一些芯片架構(gòu)創(chuàng)新,第三個(gè)則是軟硬件的深度優(yōu)化 ,接下來(lái)我們一個(gè)一個(gè)說(shuō)。
臺(tái)積電5納米工藝
制造工藝這一點(diǎn),很多文章都沒(méi)有提及,或是沒(méi)有重視。事實(shí)上,先進(jìn)工藝對(duì)于芯片的能效提升,起著非常重要的作用。 因?yàn)檫^(guò)去十年里芯片性能的提升,有超過(guò)60%直接或間接受益于半導(dǎo)體工藝的提升,而只有17%來(lái)自于芯片架構(gòu)的升級(jí) 。AMD能“彎道超車”英特爾的最主要原因之一,就是拋棄格羅方德,轉(zhuǎn)向臺(tái)積電的懷抱。
M1應(yīng)該是目前世界上第一個(gè)、也是唯一一個(gè)使用了臺(tái)積電5納米工藝的筆記本處理器芯片,其中包含了160億支晶體管。根據(jù)臺(tái)積電的數(shù)據(jù),和前一代的7納米工藝相比,使用5納米工藝制造的晶體管:密度提升80%,速度提升15%,功耗降低30%。有了新的制造工藝,可以在芯片面積保持不變的情況下,往一顆芯片里塞進(jìn)去更多的晶體管,而且這些晶體管的功耗更低、性能更高。
也就是說(shuō),即使蘋(píng)果什么都不做,單純把A13芯片用5納米工藝流片出來(lái),理想情況下就能達(dá)到這些“免費(fèi)”的性能、功耗和面積優(yōu)化。當(dāng)然實(shí)際情況要比這個(gè)復(fù)雜很多。
要知道,2019款16寸MacBook Pro用的還是英特爾的第九代CPU,使用的是英特爾14納米工藝,這和臺(tái)積電的5納米工藝至少有兩代的代差。所以也這也不難理解為什么從跑分來(lái)看,搭載M1的MacBook Air會(huì)降維打擊16寸MacBook Pro。
芯片架構(gòu)創(chuàng)新
這里特別要說(shuō)的是蘋(píng)果的UMA結(jié)構(gòu),也就是這次展示的統(tǒng)一內(nèi)存架構(gòu)。 設(shè)計(jì)芯片的一個(gè)大的原則就是,存儲(chǔ)數(shù)據(jù)的地方離使用數(shù)據(jù)的地方越近,性能就越高、功耗也越低 。所以蘋(píng)果就把原本在電路板上的內(nèi)存顆粒,整合到芯片的封裝里。這樣最主要的好處就是讓芯片上的那些CPU、GPU、AI引擎都能夠更快的訪問(wèn)到內(nèi)存,同時(shí)也大幅降低了數(shù)據(jù)傳輸?shù)墓?。此外,各個(gè)模塊之間可以共享內(nèi)存,也省去了很多數(shù)據(jù)搬運(yùn)、拷貝的開(kāi)銷。
值得注意的是,這種架構(gòu)設(shè)計(jì)和封裝方法其實(shí)并非蘋(píng)果獨(dú)有,其實(shí)在英偉達(dá)的A100GPU、AMD的Rome處理器,還有英特爾和賽靈思的高端FPGA芯片里,都使用了類似的方法,可以在同一個(gè)芯片封裝里集成了多個(gè)不同的計(jì)算和存儲(chǔ)單元。
這種封裝方式的具體的實(shí)現(xiàn)方式有很多種,比如AMD使用的芯粒chiplets,還有英特爾的EMIB技術(shù),還有賽靈思在FPGA中使用的SSI,也就是堆疊硅片互聯(lián)技術(shù)等等。 業(yè)界把這些技術(shù)都稱為是2.5D封裝技術(shù),也就是是在水平方向上連接多個(gè)小硅片,然后組成一個(gè)大的芯片 。關(guān)于EMIB和SSI技術(shù)的具體分析,可以看之前寫(xiě)過(guò)的這兩篇文章 《3D FPGA技術(shù) - 上篇》 《3D FPGA技術(shù) - 下篇》 。
這里多提一句,英特爾還有一個(gè)名叫Foveros的3D封裝技術(shù)。Foveros來(lái)自于希臘語(yǔ),本意是“牛逼”。 這個(gè)技術(shù)不是在水平方向上擴(kuò)展,而是垂直擴(kuò)展。 也就是說(shuō),它可以將內(nèi)存顆粒、CPU、GPU、還有其他的芯片單元,像三明治一樣疊在一起,這樣就使得內(nèi)存和CPU的距離減少到0.1毫米左右,所以會(huì)進(jìn)一步增加內(nèi)存帶寬、減少傳輸延時(shí),同時(shí)不會(huì)增加芯片的面積。在英特爾的Lakefiled CPU里就使用了這種技術(shù)。關(guān)于Foveros技術(shù)的更多內(nèi)容,也可以看一下之前的文章 《2019年會(huì)是10納米工藝的大年嗎》 。
蘋(píng)果生態(tài)的協(xié)同優(yōu)化
蘋(píng)果的M1芯片取得能效大幅提升的第三個(gè)原因,就是蘋(píng)果軟硬件的協(xié)同深度優(yōu)化,這一點(diǎn)我認(rèn)為也是蘋(píng)果最大的競(jìng)爭(zhēng)優(yōu)勢(shì)。這是因?yàn)?,前面說(shuō)的5納米工藝,或者芯片架構(gòu)和封裝技術(shù)的升級(jí),其他廠商可能也會(huì)(或者必然會(huì))掌握和采用這些技術(shù)。 但是只有結(jié)合軟硬件、操作系統(tǒng)和生態(tài)做深度優(yōu)化,才是蘋(píng)果獨(dú)有的 。而且這也是為什么有且只有蘋(píng)果能將基于arm架構(gòu)的CPU真正做成牛逼的產(chǎn)品賣出來(lái)的原因。
有人說(shuō),蘋(píng)果的M1芯片的面世證明了Wintel聯(lián)盟并不難破,這一點(diǎn)我并不認(rèn)同?;赼rm架構(gòu)的消費(fèi)級(jí)CPU已經(jīng)說(shuō)了很多很多年了,但放眼目前除蘋(píng)果之外的軟硬件廠商有誰(shuí)能堪此大任呢?英特爾amd肯定不會(huì)做這種自廢武功的事情,不用多說(shuō),微軟之前嘗試過(guò)做一下基于arm的生態(tài),但是以失敗告終。那么是讓聯(lián)想、戴爾去做arm筆記本,還是讓高通英偉達(dá)這些非cpu廠商去做生態(tài)呢,其實(shí)目前來(lái)看都是很不現(xiàn)實(shí)的。
關(guān)于軟硬件協(xié)同優(yōu)化這一點(diǎn)我很認(rèn)同某乎大v木頭龍的回答,大家可以去看一下。只要pc的軟硬件廠商還是各自為戰(zhàn),只要不同的軟硬件還需要相互兼容和適配,不管是操作系統(tǒng)、開(kāi)發(fā)工具、驅(qū)動(dòng)、CPU、GPU、內(nèi)存等等,這個(gè)生態(tài)系統(tǒng)就很難破解。生態(tài)系統(tǒng)有時(shí)候就像一個(gè)從山頂滾落的雪球,你一旦被他卷進(jìn)去就很難靠自己的力量逃脫,更不用說(shuō)靠一己之力改變它的運(yùn)行軌跡。
相比之下,蘋(píng)果有著自己的生態(tài), 這次M1芯片的發(fā)布,也正式完成了這個(gè)生態(tài)的閉環(huán) 。 你可以說(shuō)蘋(píng)果生態(tài)太封閉,或者有這樣那樣的問(wèn)題,但只有這種封閉的生態(tài)才有可能產(chǎn)生像M1芯片這樣的東西。
從Anandtech的這里就能看到, 在過(guò)去的5年里,英特爾芯片的單線程性能提升了28%,而蘋(píng)果則提升了將近3倍 。所以,蘋(píng)果采用自研的Apple Silicon芯片,也是必然的選擇。
但是,與英特爾AMD不同的是,你不可能單獨(dú)去買這個(gè)M1芯片。為了使用M1的高能效,就必須買蘋(píng)果的整個(gè)生態(tài)。而且即使像蘋(píng)果這樣的閉環(huán)生態(tài),全面轉(zhuǎn)向arm架構(gòu)也需要兩年的時(shí)間,這里面會(huì)涉及大量的生態(tài)遷移工作,也勢(shì)必會(huì)給開(kāi)發(fā)者造成很多額外的工作壓力。所以這個(gè)生態(tài)轉(zhuǎn)換并不容易。
結(jié)語(yǔ)
蘋(píng)果M1芯片的發(fā)布,也代表著基于arm架構(gòu)的消費(fèi)級(jí)處理器重新登上歷史舞臺(tái),并且開(kāi)始正面迎擊基于x86架構(gòu)的傳統(tǒng)處理器。雖然目前說(shuō)x86架構(gòu)被arm取代還為時(shí)尚早,但在很多領(lǐng)域,比如mac電腦擅長(zhǎng)的視頻和圖像等內(nèi)容創(chuàng)作領(lǐng)域,M1芯片已經(jīng)正式顛覆了人們對(duì)高能效的認(rèn)知。相信隨著更多后續(xù)產(chǎn)品的出現(xiàn),會(huì)有更多的顛覆發(fā)生。同時(shí),x86陣營(yíng)如何應(yīng)戰(zhàn),也是非常值得關(guān)注的重點(diǎn)。
責(zé)任編輯:tzh
-
芯片
+關(guān)注
關(guān)注
460文章
52520瀏覽量
441001 -
ARM
+關(guān)注
關(guān)注
134文章
9353瀏覽量
377598 -
cpu
+關(guān)注
關(guān)注
68文章
11080瀏覽量
217110 -
蘋(píng)果
+關(guān)注
關(guān)注
61文章
24547瀏覽量
203994
發(fā)布評(píng)論請(qǐng)先 登錄
評(píng)論