chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

嵌入式性能面臨的挑戰(zhàn)及下一代嵌入式處理器架構(gòu)

454398 ? 來源:EDN ? 作者:Michael Thompson ? 2021-03-24 11:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:Michael Thompson, 新思科技高級產(chǎn)品營銷經(jīng)理

由于工藝節(jié)點從云端拓展到互聯(lián)網(wǎng)邊緣與端點,高端嵌入式應(yīng)用也隨之發(fā)生轉(zhuǎn)變。性能需求迅速演進,并改變了處理器架構(gòu)及其在設(shè)計中的實現(xiàn)方式。這是增加多核處理器的應(yīng)用以提供更高性能的背后原因。目前大多數(shù)高端處理器都支持雙核和四核配置。有些處理器最多支持8個CPU核心,但即便如此無法滿足存儲、汽車、網(wǎng)絡(luò)和5G等新興應(yīng)用的性能需求。下一代嵌入式應(yīng)用需要對大型CPU集群和專用硬件加速器提供可擴展的支持,以實現(xiàn)所需的性能。大型多核處理器需要新的架構(gòu)方法來提供更高的性能,并且不會給嵌入式設(shè)計者帶來其他實現(xiàn)和時序收斂問題。

嵌入式性能面臨的挑戰(zhàn)

毋庸諱言,先進工藝節(jié)點已無法像從前那樣提供更高時鐘頻率和更低功耗。各代工藝節(jié)點的邏輯速度在持續(xù)增長,但內(nèi)存訪問時間卻沒有變化(圖1)。處理器中的限速路徑幾乎總是經(jīng)過內(nèi)存。由于半導(dǎo)體物理學(xué)的真正局限性,這類情況在未來工藝節(jié)點上也不太可能發(fā)生轉(zhuǎn)變。

圖1:嵌入式存儲器性能差距

同時,嵌入式應(yīng)用的最高時鐘頻率已達到1GHz–2GHz范圍(圖2)。誠然,有些時鐘頻率高于2GHz,但這是例外。對于多數(shù)應(yīng)用而言,這是無法實現(xiàn)的。功耗和面積都是有限的,這兩者都會隨著時鐘頻率迅速增加。大多數(shù)嵌入式設(shè)計的時鐘頻率都低于1GHz。未來這一趨勢不會改變。就多數(shù)嵌入式設(shè)計而言,通過增加時鐘頻率來提高性能是不現(xiàn)實的。

問題在于針對嵌入式應(yīng)用的性能需求在不斷增多。這是由競爭、新特性的添加和應(yīng)用空間需求的變化所造成的。例如,更大容量和更高訪問速度的需求使得SSD驅(qū)動器的尺寸迅速增大。此外,計算機儲存和AI功能也被添加至嵌入式應(yīng)用中,以延長驅(qū)動器壽命和提升數(shù)據(jù)訪問性能。因此上述綜合因素都對SSD控制器以及用于實現(xiàn)新功能的處理器提出了更高的性能需求。

提高處理器性能

許多方法已經(jīng)用于提高處理器性能。多年來,增加流水線級數(shù)一直被用于解決內(nèi)存限速問題。例如,DesignWare? ARC? HS處理器具有10級流水線,兩個周期的內(nèi)存訪問,能夠在16FFC工藝中提供1.8GHz的時鐘頻率(最差情況下)。嵌入式設(shè)計的時鐘頻率是有限制的,因此在處理器的流水線上增加更多的處理級別并不會帶來什么改善。今后這一情況可能會改變,但現(xiàn)如今10級流水線是嵌入式設(shè)計的最佳選擇。

就性能增益與增加的面積和功耗對比而言,超標(biāo)量實現(xiàn)是一個很好的折衷方案。從單一發(fā)射架構(gòu)轉(zhuǎn)變至雙發(fā)射架構(gòu)能夠在面積和功耗有限增加的情況下將RISC性能提升40%。對于嵌入式處理器來說,這是一個很好的折衷方案。采用三發(fā)射或四發(fā)射架構(gòu)將會進一步增加CPU面積與功耗,且性能提升幅度較小。以任何代價提高性能從來都不是嵌入式處理器的目標(biāo)。

添加亂序(OoO)執(zhí)行可以提高嵌入式應(yīng)用的性能,且不會增加時鐘頻率。通常,支持完整亂序的CPU會給嵌入式應(yīng)用帶來適得其反的效果。而采用有限亂序的方法可以在不增加處理器面積的情況下獲得最佳性能提升。有限亂序通常用于高端嵌入式處理器。

緩存的目的是為了讓內(nèi)存更加靠近處理器,從而提高性能。緩存支持處理器的單周期數(shù)據(jù)存取。將處理器所需信息存放于緩存中能夠提升性能。經(jīng)常使用的代碼和數(shù)據(jù)保存在一級緩存中。使用較少的代碼和數(shù)據(jù)保存在訪問速度較慢的二級緩存或外部內(nèi)存中,并在需要時進行讀取。對于多核處理器來說,保持一級數(shù)據(jù)緩存之間的一致性也可以提高性能。一級緩存和一致性在嵌入式處理器中很常見,而二級緩存(和三級緩存)僅用于高端應(yīng)用。

在嵌入式設(shè)計中采用多個處理器的趨勢正不斷演進。幾年前,一個典型的片上系統(tǒng)(SoC)只包含一到兩個處理器。如今,即便是低端設(shè)計,處理器數(shù)量也超過5個,而且還在不斷增加。為了支撐這一轉(zhuǎn)變,中高端嵌入式應(yīng)用的處理器提供了多核實現(xiàn)方式。支持兩個、四個和八個CPU核心的處理器已經(jīng)推出。程序員可以使用Linux或其他操作系統(tǒng)在CPU內(nèi)核之間順暢地進行操作,同時平衡執(zhí)行以提高性能。

硬件加速器正越來越多地應(yīng)用于嵌入式設(shè)計。它們以最小的功耗和面積提供高性能,同時減輕處理器的負擔(dān)。硬件加速器的主要缺點是它們的不可編程性。添加加速器使之與處理器并行工作可以緩解這種情況。然而,現(xiàn)有處理器只能有限度地支持硬件加速器,有的甚至無法提供支持。有些處理器(如ARC處理器)支持自定義指令,允許用戶向處理器流水線添加硬件。盡管自定義指令很誘人,但硬件加速器也帶來了其他好處,與處理器并行使用時,可以顯著提高性能。

嵌入式應(yīng)用的處理器性能提升存在許多挑戰(zhàn)。處理器已經(jīng)支持更深層次的流水線技術(shù),超標(biāo)量實現(xiàn)和亂序功能能夠有所幫助,但也只能到此為止。緩存技術(shù)已經(jīng)非常豐富,一致性也是如此,因此不太可能取得進一步的進展。在設(shè)計中采用更多的CPU核心數(shù)與硬件加速器是嵌入式設(shè)計人員正采取的更高性能實現(xiàn)途徑。

下一代嵌入式處理器架構(gòu)

下一代處理器將支持大型多核實現(xiàn)和硬件加速(圖3)。處理器供應(yīng)商要做的不僅僅是向現(xiàn)有處理器添加接口。支持4個或8個CPU內(nèi)核的處理器已經(jīng)達到了最大頻率限制,并且在時序收斂方面可能會出現(xiàn)重大問題。增加更多的內(nèi)核只會讓這一問題變得更糟糕。下一代處理器必須從內(nèi)部處理器互連的完全重構(gòu)開始,改進時序收斂,解決速度限制,并增加內(nèi)部帶寬。外部接口的帶寬也必須增加,以支持?jǐn)?shù)據(jù)進出處理器。

圖3:下一代嵌入式處理器架構(gòu)

服務(wù)質(zhì)量(QoS)技術(shù)在片上網(wǎng)絡(luò)(NOC)中得到了廣泛的應(yīng)用,但在多核處理器中的應(yīng)用卻很有限。這種情況將在下一代處理器中發(fā)生改變,讓程序員能夠管理每個CPU核心和加速器的內(nèi)部帶寬,從而最大限度地提高性能。這取決于應(yīng)用,雖然并非每個設(shè)計都需要服務(wù)質(zhì)量技術(shù),但在其他設(shè)計中,它對于確??深A(yù)測性能至關(guān)重要。

大型處理器集群的優(yōu)勢

大型多核處理器比小型多核處理器具有優(yōu)勢。采用一個具有12個CPU核心的處理器,而不是使用具有4個CPU核心的三個處理器集群,將減少CPU核心之間的延遲,并支持對內(nèi)核的直接窺探。大型處理器集群的另一個優(yōu)勢是能提供更優(yōu)越的軟件擴展性。具有12個CPU核心的處理器為程序員提供了更大的軟件分區(qū)靈活性,用于處理任務(wù)的核心數(shù)量可以根據(jù)需要的性能動態(tài)進行分配。在多個處理器集群中,由于缺乏CPU內(nèi)核之間的統(tǒng)一訪問,因此很難獲得這種級別的軟件性能控制。

大型多核處理器也將從與硬件加速器的緊密耦合中獲得優(yōu)勢。將硬件加速器接口移動到處理器內(nèi)部,而不是通過SoC總線連接它們,將減少SoC總線上的延遲和流量,同時提高數(shù)據(jù)共享和系統(tǒng)性能。采用共享用戶寄存器也可以提高加速器上可編程控制的效率。

ARC HS5x/HS6x

新思科技公司(Synopsys)下一代DesignWare ARC HS5x和ARC HS6x處理器IP利用前面描述的許多方法來提高處理器性能。這些處理器具有高速10級、雙發(fā)射流水線,在功耗和面積有限的情況下提高了功能單元的利用率。ARC 64位 HS6x處理器具有完整的64位流水線和寄存器文件,支持64位虛擬地址空間和52位物理地址空間,可以直接尋址當(dāng)前和未來的大內(nèi)存,并支持128位加載和存儲,以實現(xiàn)高效的數(shù)據(jù)移動。

圖4:DesignWare ARC HS5x/HS6x處理器IP框圖

32位ARC HS5x和64位HS6x處理器的多核版本都包含一個先進的高帶寬內(nèi)部處理器互連結(jié)構(gòu),其設(shè)計旨在通過異步時鐘和高達800 GB/s的內(nèi)部聚合帶寬來簡化時序收斂。新款A(yù)RC HS處理器的多核版本包括一個創(chuàng)新的互連結(jié)構(gòu),可連接多達12個核心,支持多達16個硬件加速器的接口。為了進一步簡化時序收斂,每個核位于自己的功率域中,并且與其他核具有異步時鐘關(guān)系。跟所有ARC處理器一樣,HS5x和HS6x處理器都高度可配置,并采用ARC Processor Extension(APEX)技術(shù),支持自定義指令,可滿足每個嵌入式應(yīng)用的獨特性能、功耗和面積要求。

為了加速軟件開發(fā),ARC HS5x和HS6x處理器由ARC MetaWare開發(fā)工具套件提供支持,可生成高效代碼。處理器的開源軟件支持包括Zephyr實時操作系統(tǒng)、優(yōu)化的Linux內(nèi)核、GNU編譯器集合(GCC)、GNU調(diào)試器(GDB)和相關(guān)的GNU編程實用程序(二進制工具)。

總結(jié)

由于嵌入式應(yīng)用的性能需求將日益增多,嵌入式應(yīng)用中所采用的處理器也必須隨之提高性能。鑒于面積與功耗的有限性,以及處理器性能簡易提升已取得進展,這將面臨挑戰(zhàn)。先進工藝節(jié)點不再像以前那樣帶來性能提升,嵌入式處理器的速度也受到了限制。超標(biāo)量和亂序功能在高端處理器中很常見,但64位(盡管必要)提供的性能提升有限。新一代多核處理器需要支持8個以上的CPU核心數(shù),并需要采用硬件加速器內(nèi)部互連結(jié)構(gòu)。新處理器如DesignWare ARC HS5x和HS6x處理器IP將提供可擴展的性能和功能,并讓設(shè)計師能夠解決其嵌入式應(yīng)用的功耗和面積需求。新款處理器采用先進的架構(gòu)與高速內(nèi)部互連結(jié)構(gòu),不僅滿足了當(dāng)今高端嵌入式應(yīng)用的性能需求,同時也為未來設(shè)計留下了足夠空間。

編輯:hfy

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20170

    瀏覽量

    247975
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11229

    瀏覽量

    223215
  • 嵌入式處理器
    +關(guān)注

    關(guān)注

    0

    文章

    258

    瀏覽量

    31654
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    重磅合作!Quintauris 聯(lián)手 SiFive,加速 RISC-V 在嵌入式與 AI 領(lǐng)域落地

    SoC 開發(fā)流程,幫開發(fā)者省時間; 優(yōu)化下一代 RISC-V 設(shè)計的性能和能效,進步拉高性能上限; 把 RISC-V 打造成能和傳統(tǒng)專有處理器
    發(fā)表于 12-18 12:01

    Amphenol 4 端口千兆以太網(wǎng)交換機:適用于下一代無人機、機器人和嵌入式應(yīng)用

    Amphenol 4 端口千兆以太網(wǎng)交換機:適用于下一代無人機、機器人和嵌入式應(yīng)用 在電子工程領(lǐng)域,為下一代無人機、機器人和嵌入式應(yīng)用開發(fā)先進的網(wǎng)絡(luò)解決方案至關(guān)重要。Amphenol
    的頭像 發(fā)表于 12-10 15:25 ?191次閱讀

    嵌入式和FPGA的區(qū)別

    開發(fā)中做出更明智的技術(shù)選擇。 基本概念解析 嵌入式系統(tǒng)(Embedded System)是種專用計算機系統(tǒng),通常包含微處理器/微控制、存儲
    發(fā)表于 11-19 06:55

    一代嵌入式開發(fā)平臺 AMD嵌入式軟件和工具2025.1版現(xiàn)已推出

    AMD 2025.1 版嵌入式軟件和工具是面向新一代嵌入式系統(tǒng)開發(fā)而打造的綜合平臺,全面加速概念構(gòu)想到部署落地。 2025.1 版嵌入式軟件和工具的新 增功能 AMD
    的頭像 發(fā)表于 08-20 09:15 ?3682次閱讀

    MicroBlaze處理器嵌入式設(shè)計用戶指南

    *本指南內(nèi)容涵蓋了在嵌入式設(shè)計中使用 MicroBlaze 處理器、含存儲 IP 核的設(shè)計、IP integrator 中的復(fù)位和時鐘拓撲結(jié)構(gòu)。獲取完整版《 MicroBlaze 處理器
    的頭像 發(fā)表于 07-28 10:43 ?830次閱讀

    AMD嵌入式處理器為您的應(yīng)用添能助力

    AMD 面向嵌入式應(yīng)用打造高性能、高能效處理器,全方位滿足網(wǎng)絡(luò)、存儲、汽車、工業(yè)、零售、醫(yī)療、測試與測量等領(lǐng)域的各種需求。無論您的應(yīng)用是涉及 AI 加速、機器視覺、安全數(shù)據(jù)處理還是高分
    的頭像 發(fā)表于 07-07 14:09 ?1724次閱讀

    Linux嵌入式和單片機嵌入式的區(qū)別?

    Processor Unit)。 2. 單片機嵌入式(也稱為嵌入式微控制器MCU): 定義:種集成電路,能夠在個芯片上完成各種計算、控制和管理任務(wù)。 特點:小型化、低功耗、成
    發(fā)表于 06-20 09:46

    龍芯2K3000 | 重塑工控嵌入式處理器性能邊界

    【前言】當(dāng)ARM架構(gòu)長期主導(dǎo)工控嵌入式領(lǐng)域,場新的自主核心硬件革命正蓄勢待發(fā)!龍芯中科新一代高集成處理器龍芯2K3000即將震撼登場——以
    的頭像 發(fā)表于 06-19 08:32 ?1591次閱讀
    龍芯2K3000 | 重塑工控<b class='flag-5'>嵌入式</b><b class='flag-5'>處理器</b><b class='flag-5'>性能</b>邊界

    嵌入式主板開發(fā)詳細指南

    嵌入式主板開發(fā)涉及硬件設(shè)計、軟件集成、系統(tǒng)優(yōu)化等多個環(huán)節(jié),需要結(jié)合具體應(yīng)用場景進行深度定制。以下是嵌入式主板開發(fā)的詳細指南,涵蓋關(guān)鍵步驟、工具、挑戰(zhàn)及實際案例:、開發(fā)流程與關(guān)鍵步驟1
    的頭像 發(fā)表于 04-02 11:35 ?961次閱讀
    <b class='flag-5'>嵌入式</b>主板開發(fā)詳細指南

    服務(wù)級芯片進軍嵌入式市場,AMD這顆處理器駕馭AI洪流

    市場進行了優(yōu)化,在計算能力與專門設(shè)計的嵌入式特性之間實現(xiàn)平衡,增強產(chǎn)品壽命、系統(tǒng)彈性和嵌入式應(yīng)用開發(fā)的便利性。 ? ? 該處理器采用成熟的Zen 5架構(gòu),提供領(lǐng)先的
    的頭像 發(fā)表于 03-28 09:18 ?3804次閱讀
    服務(wù)<b class='flag-5'>器</b>級芯片進軍<b class='flag-5'>嵌入式</b>市場,AMD這顆<b class='flag-5'>處理器</b>駕馭AI洪流

    AMD EPYC嵌入式9005系列處理器的功能特性

    AMD EPYC(霄龍)嵌入式 9005 系列處理器嵌入式應(yīng)用帶來服務(wù)性能。它們基于“Zen 5”
    的頭像 發(fā)表于 03-27 11:30 ?1338次閱讀
    AMD EPYC<b class='flag-5'>嵌入式</b>9005系列<b class='flag-5'>處理器</b>的功能特性

    AMD EPYC嵌入式9005系列處理器發(fā)布

    AMD(超威,納斯達克股票代碼:AMD )今日宣布推出第五 AMD EPYC(霄龍)嵌入式處理器,擴展其 x86 嵌入式處理器產(chǎn)品組合。
    的頭像 發(fā)表于 03-12 17:08 ?1404次閱讀

    嵌入式主板的概述與發(fā)展

    未來發(fā)展趨勢進行深入探討。嵌入式主板的基本概念嵌入式主板是指為嵌入式系統(tǒng)設(shè)計的電路板,它通常集成了微處理器、內(nèi)存、輸入輸出接口等關(guān)鍵組件。與
    的頭像 發(fā)表于 01-13 16:30 ?1211次閱讀
    <b class='flag-5'>嵌入式</b>主板的概述與發(fā)展

    ARM架構(gòu)嵌入式主板特點

    極其廣泛。ARM架構(gòu)嵌入式主板有什么特點呢?、工作時間及環(huán)境:ARM主板不受時間限制,可常開機,無需人員維護。在有電源調(diào)節(jié)的情況下,只要接通電源,就會自動啟動,
    的頭像 發(fā)表于 12-31 16:03 ?1989次閱讀
    ARM<b class='flag-5'>架構(gòu)</b><b class='flag-5'>嵌入式</b>主板特點

    ARM嵌入式通信協(xié)議及應(yīng)用

    同工作至關(guān)重要。 、ARM嵌入式系統(tǒng)概述 ARM(Advanced RISC Machines)是種基于精簡指令集計算機(RISC)的處理器架構(gòu)
    的頭像 發(fā)表于 12-28 09:18 ?1539次閱讀