chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

硬件異構:兩種不同的內核

中科院半導體所 ? 來源:老石談芯 ? 作者:老石 ? 2022-04-13 10:26 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

說起近年來CPU領域的進展,很多人都知道蘋果的M1系列芯片、以及它取得了多少多少提升。相比之下,老牌CPU廠商英特爾的關注度卻越來越低,最主要的原因就是這個牙膏廠擠牙膏的速度太慢了。

不過,在英特爾發(fā)布了最新的12代酷睿處理器之后,事情就完全不一樣了。 國內外很多知名UP主都對它做了極其深入的性能測試,并且有點出乎意料地收獲了幾乎一邊倒的好評。很多人甚至說,英特爾這次把牙膏擠爆了、12代酷睿會幫助英特爾重新走回巔峰。

如果你對電腦或者數(shù)碼產(chǎn)品不是特別熟悉,可能會問:一個產(chǎn)品的正常升級換代,取得性能提升不是很正常的嗎? 升級帶來性能提升是正常的,但取得這么大的性能提升就不那么“正常”了,英特爾必然做對了什么事情。

所以問題來了,12代酷睿究竟做對了什么?究竟是一不小心走運擠爆了牙膏,還是發(fā)現(xiàn)了能夠源源不斷產(chǎn)生新牙膏的方法?

先說結論,我認為英特爾找到了一個新配方,能持續(xù)大幅提升芯片的性能。這個配方的名字,叫芯片架構的創(chuàng)新。而這個配方最重要的那味藥,就是異構。 問題又來了,異構究竟是什么東西?它為什么能幫助12代酷睿取得了如此大的提升?更重要的是對于普通消費者來說,怎么才能用得上這種創(chuàng)新?對于我們來說又有什么具體的意義?今天的文章我們就來好好說說這些問題。

什么是異構

先來看看“異構”這個詞到底是什么意思。從字面意思來看,異就是不同,構就是架構或者結構,所以異構其實就是“不同的結構”。它的反義詞是同構,也就是“相同的結構”。

如果你沒聽說過這兩個詞也完全沒關系,其實在我們日常生活中關于異構和同構的例子是有很多的。就拿我們家里的裝修和收納舉例,以前很多房屋裝修都是同樣的風格,看起來像是一個模子印出來的。收納也很簡單,比如廚房里都用一樣的四四方方的櫥柜,去收納各種鍋碗瓢盆。這其實就是同構。

但是我們在實際應用中就發(fā)現(xiàn),這種結構并不好用。因為我們有各種各樣的鍋碗瓢盆,放在同樣的櫥柜里就會導致有的地方放不下,有的地方卻太空了。所以很多現(xiàn)代化的裝修,都是針對不同的廚具去針對性的設計收納空間,并且能最大限度的利用空間。這種方式其實就是異構。 同樣的例子還有很多,比如一列火車里有一等二等餐車臥鋪這樣不同的車廂,而不全都是相同的座位,這就是一種異構。我們吃的飯也有川菜粵菜漢堡炸雞這樣不同的菜系和品種,而不都是大鍋飯,所以這也是一種異構。

所以從廣義上來看,只要不是同構,就是異構。 但是,異構其實還有更進一步的意思。比如機場的行李管理系統(tǒng),會把行李按照不同的航班進行調度,同一個航班,也會按艙位的不同進行先后處理。比如我們在等行李的時候,頭等艙的行李會先出來,而我們坐經(jīng)濟艙的往往要等很久才能等到自己的行李。這里其實就是在異構這個概念里,增加了優(yōu)先級和調度的概念。也就是說,由于結構的不同,對它的處理和應用的方式也是不同的。

再拿前面的廚房收納來舉例,我們會把盤子放在櫥柜的抽屜里,但是應該先放大盤子、再放小盤子,這樣才不會倒。放玻璃杯的時候,抽屜肯定就放不下了,所以應該放在杯具專用的地方,可能很窄很高,正好能放下杯子。所以這些不同結構的櫥柜和抽屜,就組成了一個異構的收納體系。 回到前面的問題,我們?yōu)槭裁匆卯悩嬆??和同構相比,異構更加高效,每個部分各司其職,就像玩游戲的時候用的一套連招,能夠最大限度地發(fā)揮它的力量。

但使用異構的另一方面原因,其實是由于當技術發(fā)展到一定程度的時候,不可避免的遇到很多限制。很多年前,傳統(tǒng)地提升CPU性能的方法,就是堆料,也就是不斷增加CPU核心的數(shù)量,從而讓性能隨著核心數(shù)的增加而線性增加。多核架構在十幾年前就是非常熱門的研究方向,人們認為,只要能夠編寫和運行并行軟件,就可以將處理器架構直接擴展到數(shù)千個核心。

當然了現(xiàn)實總是非常殘酷。在之前的文章里介紹過,當時還在德州大學奧斯丁分校的道格博格爾教授寫了一篇文章,研究并提出了所謂的“暗硅效應”。

a0c31cc2-bacd-11ec-aa7f-dac502259ad0.png

它說的是雖然可以不斷增加核心數(shù)量,但由于功耗的限制,我們卻無法讓這些核心同時工作。這就像一個大樓有很多房間,但由于供電量有限,我們無法同時開啟每個房間的燈,這就讓這個大樓在夜里看起來有很多黑暗的部分,這也是暗硅這個詞得名的原因。

暗硅效應的提出,完全改變了芯片產(chǎn)業(yè)發(fā)展的方向。人們意識到即使不斷的堆核,并且開發(fā)出了并行軟件,這種同構的方法帶來的性能提升也會非常有限。所以異構計算就應運而生了。事實上,在計算機領域,異構計算是一個近年來非常熱門的方向,就是因為異構計算能夠充分利用CPU、GPUFPGA、ASIC等等不同芯片結構的特點,相互取長補短,從而實現(xiàn)更加高性能低功耗的計算系統(tǒng)。

對于CPU設計本身,也慢慢出現(xiàn)了異構的方法。比如手機的處理器絕大多數(shù)都是基于ARM的架構,它就采用了大小核的設計。在蘋果的M1芯片里,也采用了類似的設計方法。這些都不是新鮮事兒了。

但是新鮮的是,在x86架構的CPU里,12代酷睿Alder Lake是第一次嘗試了這種性能核+能效核的異構方法,結構就取得了非常好的效果。

硬件異構:兩種不同的內核

Alder Lake最主要的特點,就是采用了性能核+能效核的架構設計。它最大的特點就是有很強的擴展性和靈活性。

a0e1d50e-bacd-11ec-aa7f-dac502259ad0.png

比如全系列Alder Lake都是采用了相似的設計,不管是臺式機、筆記本還是超輕薄的商務本,CPU架構都是相同的,只不過兩種類型的核心數(shù)量有區(qū)別。比如桌面端CPU最高可以支持8個性能核、8個能效核,面向筆記本的12代酷睿又分成了HPU三個子系列:H系列面向高性能移動平臺,可以支持4~6個性能核、4~8個能效核,最多14核20線程;面向高性能筆記本的P系列也是如此,性能核支持2~6個,能效核都為8個;而主打輕薄筆記本的U系列,最多支持2個性能核、8個能效核。使用這樣的設計,就能根據(jù)特定的應用場景,針對性的配置芯片核心的數(shù)量和種類,以取得性能和功耗的平衡和優(yōu)化。

Alder Lake的能效核代號為Gracemont。值得注意的是,它并沒有采用業(yè)界通用的“低功耗”內核的這個說法,而是稱為“高能效”,這其實代表著Gracemount能夠很好的平衡性能和功耗這兩個非常重要但貌似相互矛盾的性能指標。

在之前架構日的文章里詳細介紹過,Gracemount在架構設計上也有很多創(chuàng)新和進步,比如在前端設計里采用了64KB指令緩存,并且進一步優(yōu)化了分支預測單元。此外它還包含了兩個3寬度的亂序解碼器,這也是英特爾能效核的主要特點,它不僅可以單周期完成高達六個指令的解碼,也可以在兩個解碼器集群之間做負載均衡和亂序執(zhí)行,進一步提升操作的并行性,從而提升性能。能效核的后端也提升了寬度,并且集成了多種整型、浮點型、還有向量運算單元,支持不同形式的運算和指令集擴展。

對于性能核來說,提升就更明顯了。Alder Lake里的性能核代號為Goldencove,它的設計目標非常明確,就是對單線程性能的極致擴展。比如它前后端的流水線、執(zhí)行單元、亂序窗口、片上緩存和存儲系統(tǒng)都采用了更寬和更深的設計,它還集成了機器學習的方法,來更智能的做分支預測和流水線資源的釋放,進一步提升系統(tǒng)的吞吐量。

打個簡單的比方,如果我們把CPU比作水龍頭,指令和數(shù)據(jù)就是水龍頭里流的水。這次性能核就把水龍頭的水管做的更寬了,口做的更大了,而且加入了很多智能化的水量控制系統(tǒng),就讓整體的流量變的更大了。

12代酷睿是英特爾首個采用混合架構的CPU產(chǎn)品,除了性能核與能效核之外,它還集成了對DDR4和DDR5等種內存架構的支持,也支持Wifi6E、Thunderbolt4、PCIe5.0x16等等這些最新的接口和數(shù)據(jù)傳輸技術。所有的這些單元都是以模塊化的方式進行集成,這樣和異構的內核一起,進一步提升了CPU架構的擴展性,也能非常靈活的應對不同終端的實際需求。

對異構的軟硬件支持

有了不同的處理器內核和硬件模塊其實還不夠,為了組成一個高效運轉的異構芯片,同樣重要的其實是如何把它們充分利用起來。 再拿我們裝修房子的例子,就算按現(xiàn)代的標準裝修了整間屋子,如果住的人不知道怎么用,把東西到處亂放,那么到頭來屋子里肯定還是一團糟。這個時候我們可以咨詢專門的收納師,或者直接請他們來幫忙進行收納。 芯片設計也是這樣,這里的收納師,其實有兩層,一個是調度器,另一個是操作系統(tǒng)。在12代酷睿里,英特爾特別提出了一個叫做線程調度器的結構。這也是一個全新的結構,我總結了它的3個主要特點。

a1566874-bacd-11ec-aa7f-dac502259ad0.png

首先,它存在于操作系統(tǒng)和內核架構之間,能在納秒級別、非常精確地監(jiān)測線程和內核的運行情況。然后根據(jù)這些信息,它能為操作系統(tǒng)提供動態(tài)反饋,從而幫助操作系統(tǒng)做出最優(yōu)的調度決定。最后,它可以可以對工作負載做實時分析,確保第一時間把正確的線程分配到正確的核心。

比如對于性能要求比較高的應用,就會被優(yōu)先放在性能核上運行,一些后臺任務就會被放在能效核上運行,從而實現(xiàn)多任務的并行處理。如果這個時候有優(yōu)先級更高的高性能應用出現(xiàn),線程調度器也可以幫助操作系統(tǒng)來決定,將性能核上的哪些線程轉移到能效核上運行。整個調度的過程都是動態(tài)完成的,可以根據(jù)不同的應用靈活變化,不依賴某種固定的調度算法。

有了硬件調度器,軟件開發(fā)者就不需要糾結如何進行線程調度和資源分配了,也不需要修改已有的代碼去支持12代酷睿的異構架構。同時,使用專門的硬件單元去做線程和內核的調度,也可以更好的保證調度的性能和準確性。

當然了,操作系統(tǒng)還是需要對這個硬件調度器進行深度適配的。微軟新推出的Windows11,就有對線程調度器的優(yōu)化支持,這個其實也是windows11的一個重要特性。 所以有了軟硬件對異構的支持,就可以充分發(fā)揮異構的優(yōu)勢。就像前面提到的機場的行李管理系統(tǒng)一樣,這其實是一種進化版的異構,可以根據(jù)優(yōu)先級進行任務的合理調度和資源分配,并且?guī)矶嗳蝿盏奶幚韮?yōu)勢。

除了H系列之外,12代酷睿還有兼顧性能和功耗的P系列、以及面向低功耗的U系列,分別適合輕內容制作和對移動辦公有剛需的人群。

結語

總之,異構就是12代酷睿取得大幅能效提升的最主要原因。它不僅有能效核+性能核的混合設計模式,還有配合它進行性能釋放的線程調度器和操作系統(tǒng)的支持。有理由相信,這種異構的模式也將會成為未來CPU芯片設計的主流趨勢。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    463

    文章

    53875

    瀏覽量

    463388
  • 異構計算
    +關注

    關注

    2

    文章

    112

    瀏覽量

    17133

原文標題:異構計算,只是大小核罷了?

文章出處:【微信號:bdtdsj,微信公眾號:中科院半導體所】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    使用Firebase AI Logic生成圖像模型的兩種新功能

    為您的應用添加自定義圖像,能夠顯著改善和個性化用戶體驗,有效提高用戶參與度。本文將探討使用 Firebase AI Logic 生成圖像的兩種新功能: 其一是 Imagen 專屬編輯功能預覽版;其二
    的頭像 發(fā)表于 11-30 09:28 ?332次閱讀

    兩種電流檢測電路設計方案 高側 低側 最高耐壓90V

    常用的電流檢測電路有兩種,一是低壓側電流檢測,另一是高壓側電流檢測。 實現(xiàn)方法: 兩種電流檢測電路工作原理一致,都是將采集到的電流以電壓的形式呈現(xiàn),對電壓信號進行放大,送入ADC處
    的頭像 發(fā)表于 11-24 16:16 ?1067次閱讀
    <b class='flag-5'>兩種</b>電流檢測電路設計方案 高側 低側 最高耐壓90V

    用PLC實現(xiàn)卷徑計算的兩種算法

    卷徑計算,是動態(tài)計算如鋼卷,紙卷等存料量的一方法,它是實現(xiàn)張力控制和自動充放料、以及甩尾控制的重要前提。卷徑計算目前主流的方法有兩種,一是根據(jù)機列速度(產(chǎn)線速度)和和被測卷的轉動角速度求得;另一
    的頭像 發(fā)表于 11-14 16:54 ?1809次閱讀
    用PLC實現(xiàn)卷徑計算的<b class='flag-5'>兩種</b>算法

    ADI GMSL技術兩種視頻數(shù)據(jù)傳輸模式的區(qū)別

    本文深入介紹GMSL技術,重點說明用于視頻數(shù)據(jù)傳輸?shù)南袼啬J胶退淼滥J街g的差異。文章將闡明這兩種模式之間的主要區(qū)別,并探討成功實施需要注意的具體事項。
    的頭像 發(fā)表于 10-10 13:49 ?2153次閱讀
    ADI GMSL技術<b class='flag-5'>兩種</b>視頻數(shù)據(jù)傳輸模式的區(qū)別

    兩種TVS有啥不同?

    當我們查看TVS二極管的規(guī)格書,常會看到有以下兩種種引腳功能標識圖:對于初學者,看到感到疑惑,他們一樣嗎?他們有啥區(qū)別?為啥有的個尖頭往外,陽極連在一起,有的個尖頭往里,陰極連在一起?一連三問。EMC小哥根據(jù)自己經(jīng)驗略作分析
    的頭像 發(fā)表于 09-15 20:27 ?722次閱讀
    這<b class='flag-5'>兩種</b>TVS有啥不同?

    兩種散熱路徑的工藝與應用解析

    背景:兩種常見的散熱設計思路 在大電流或高功率器件應用中,散熱和載流能力是PCB設計中必須解決的難題。常見的兩種思路分別是: 厚銅板方案:通過整體增加銅箔厚度(如3oz、6oz甚至更高),增強導熱
    的頭像 發(fā)表于 09-15 14:50 ?655次閱讀

    CMOS 2.0與Chiplet兩種創(chuàng)新技術的區(qū)別

    摩爾定律正在減速。過去我們靠不斷縮小晶體管尺寸提升芯片性能,但如今物理極限越來越近。在這樣的背景下,兩種創(chuàng)新技術站上舞臺:CMOS 2.0 和 Chiplet(芯粒)。它們都在解決 “如何讓芯片更強” 的問題,但思路卻大相徑庭。
    的頭像 發(fā)表于 09-09 15:42 ?885次閱讀

    貼片晶振中兩種常見封裝介紹

    貼片晶體振蕩器作為關鍵的時鐘頻率元件,其性能直接關系到系統(tǒng)運行的穩(wěn)定性。今天,凱擎小妹帶大家聊聊貼片晶振中兩種常見封裝——金屬面封裝與陶瓷面封裝。
    的頭像 發(fā)表于 07-04 11:29 ?1136次閱讀
    貼片晶振中<b class='flag-5'>兩種</b>常見封裝介紹

    異構計算解決方案(兼容不同硬件架構)

    異構計算解決方案通過整合不同類型處理器(如CPU、GPU、NPU、FPGA等),實現(xiàn)硬件資源的高效協(xié)同與兼容,滿足多樣化計算需求。其核心技術與實踐方案如下: 一、硬件架構設計 異構處理
    的頭像 發(fā)表于 06-23 07:40 ?757次閱讀

    兩種驅動方式下永磁直線開關磁鏈電機的研究

    摘要:永磁開關磁鏈電機數(shù)學模型可以等效為永磁無刷電機,普遍采用方波驅動方式。在有限元基礎上分析6/7極直線式磁鏈電機反電勢波形,采用方波和正弦波驅動方式,比較兩種方式下的電流、電壓、平均推力大小
    發(fā)表于 06-09 16:18

    兩種感應電機磁鏈觀測器的參數(shù)敏感性研究

    模式和發(fā)電模式下對閉環(huán)電壓電流模型磁鏈觀測器和滑模磁鏈觀測器參數(shù)敏感性進行了研究,通過仿真和實驗比較了這兩種觀測器對定、轉子電阻及勵磁電感的敏感性。同時還研究了基于這兩種觀測器的模型參考自適應系統(tǒng)
    發(fā)表于 06-09 16:16

    銣原子鐘與CPT原子鐘:兩種時間標準的區(qū)別

    在物理學的世界中,精密的時間測量是至關重要的。這就需要一個高度準確且穩(wěn)定的時間標準,這就是原子鐘。今天我們將探討兩種重要的原子鐘:銣原子鐘和CPT原子鐘,以及它們之間的主要區(qū)別。首先,我們來了解一下
    的頭像 發(fā)表于 05-22 15:49 ?637次閱讀
    銣原子鐘與CPT原子鐘:<b class='flag-5'>兩種</b>時間標準的區(qū)別

    電流輸出 vs 電壓輸出:兩種傳感器輸出模式有什么區(qū)別?

    在工業(yè)自動化和數(shù)據(jù)采集領域,傳感器扮演著至關重要的角色,它們將各種物理量(如溫度、壓力、流量等)轉換為可被測量和分析的電信號。而傳感器的輸出信號主要分為兩種模式:電流輸出和電壓輸出。理解這兩種輸出
    的頭像 發(fā)表于 02-08 18:21 ?2429次閱讀
    電流輸出 vs 電壓輸出:<b class='flag-5'>兩種</b>傳感器輸出模式有什么區(qū)別?

    用TLC2551采外部電壓,只有0和2096兩種值是怎么回事?

    用TLC2551采外部電壓,只有0和2096兩種值是怎么回事?求解決辦法。
    發(fā)表于 02-06 07:31

    覆銅的兩種形式是什么

    在電子電路設計與制造領域,覆銅的實現(xiàn)形式多樣,其中大面積的覆銅和網(wǎng)格銅是最為常見且各具特色的兩種,它們在不同的應用場景下發(fā)揮著關鍵作用。 大面積的覆銅,顧名思義,是指在印刷電路板(PCB)的特定區(qū)域
    的頭像 發(fā)表于 02-04 14:10 ?1077次閱讀