調(diào)查數(shù)據(jù)表明,額外的微處理器內(nèi)核并沒有被添加到SoC中,但你必須深入研究數(shù)字,才能發(fā)現(xiàn)真正的情況。原因很復(fù)雜。它們包括從軟件編程模式到市場(chǎng)轉(zhuǎn)變和新的用例等一切因素。因此,雖然調(diào)查數(shù)字看起來很平淡,但市場(chǎng)和技術(shù)動(dòng)態(tài)可能會(huì)對(duì)未來重塑這些趨勢(shì)產(chǎn)生很大影響。
在剛剛發(fā)布的一項(xiàng)功能驗(yàn)證調(diào)查中,強(qiáng)調(diào)了目前的比較,該調(diào)查由Wilson Research和西門子業(yè)務(wù)的Mentor進(jìn)行。該調(diào)查基于1492名受訪者--其中約有一半?yún)⑴c了ASICS的調(diào)查,主要涉及芯片尺寸和處理器數(shù)量等方面。調(diào)查數(shù)據(jù)顯示,“8個(gè)或更多 ”的類別有非常輕微的增加,但幾乎在調(diào)查的+/-3%的誤差范圍內(nèi)。這使得它的數(shù)量與2016年大致相同。與前兩次調(diào)查結(jié)果相比,擁有兩個(gè)處理器的SoC略有減少。
“處理器的數(shù)量在PC或便攜式設(shè)備等平臺(tái)上停滯不前,”Arteris IP的研究員兼系統(tǒng)架構(gòu)師Michael Frank說?!斑@與摩爾定律趨于平緩的關(guān)系不大,而是從軟件的角度來看,要為更多的處理器找到足夠的工作變得非常困難。除非你有高度并行的工作負(fù)載,否則要讓所有這些核心都忙碌起來真的非常困難。”
工作負(fù)載也在發(fā)生變化。“對(duì)于移動(dòng)應(yīng)用處理器來說,這是第一大批量產(chǎn)品,一般架構(gòu)似乎已經(jīng)在8個(gè)核心的集群上穩(wěn)定下來了--至少目前是這樣,”Cadence公司Tensilica IP高級(jí)集團(tuán)營(yíng)銷總監(jiān)Larry Przywara說。“我們看到的是,做視覺和AI類型的工作負(fù)載的核心數(shù)量正在上升。”
但在智能手機(jī)市場(chǎng)之外,還有很多變化的空間?!拔覀兛吹綇钠嚨交A(chǔ)設(shè)施等一系列市場(chǎng)的計(jì)算需求都在增加,”Arm公司技術(shù)副總裁、研究員Peter Greenhalgh說?!斑@意味著我們還遠(yuǎn)遠(yuǎn)沒有達(dá)到有用處理器的極限。新的應(yīng)用有不同的需求,如功率、安全和效率。從低功耗物聯(lián)網(wǎng)的角度來看,我們可以預(yù)期多核解決方案的采用會(huì)越來越多。而且我們可以預(yù)期,這種趨勢(shì)將繼續(xù)增加到更多的應(yīng)用和終端市場(chǎng)。”
Synopsys公司ASIP工具產(chǎn)品營(yíng)銷經(jīng)理Markus Willems對(duì)此表示贊同。“我們看到的情況與調(diào)查中出現(xiàn)的情況恰恰相反,即芯片上的可編程元件數(shù)量正在增加。這是由于非常特定于應(yīng)用,或者特定于領(lǐng)域的那種加速器正在變得更加軟件可編程。由32位超標(biāo)量?jī)?nèi)核組成的多核集群可能已經(jīng)變得有限,因?yàn)閮?nèi)存是一個(gè)問題?!?/p>
在規(guī)模較小的嵌入式市場(chǎng)上,似乎有一個(gè)大的變化即將發(fā)生?!叭绻覀兛匆幌虑度胧绞袌?chǎng)上出現(xiàn)的新芯片,它們通常是雙核、四核類型的配置,”Mentor公司嵌入式軟件部門高級(jí)產(chǎn)品經(jīng)理Jeffrey Hancock說?!叭匀挥幸恍┰O(shè)備是單核的,但多核終于也要在這個(gè)領(lǐng)域出現(xiàn)了。從硅供應(yīng)商的角度來看,只要人們能夠使用這些核心,只要能夠保持在他們的成本結(jié)構(gòu)之內(nèi),他們就非常樂意增加核心?!?/p>
但這些數(shù)字隱藏了更大的故事。“雖然一個(gè)ASIC中的嵌入式處理器數(shù)量可能已經(jīng)持平,但特定領(lǐng)域或?qū)S锰幚砥鞯臄?shù)量卻在增加,”Mentor公司IC驗(yàn)證解決方案部副總裁兼總經(jīng)理Ravi Subramanian說?!拔覀兛吹?,邊緣設(shè)備中的SoC正在發(fā)生本質(zhì)的變化,即數(shù)據(jù)以及計(jì)算量正在增長(zhǎng),而且大量的計(jì)算正在轉(zhuǎn)移到應(yīng)用或領(lǐng)域?qū)S锰幚砥魃??!?/p>
新的工作負(fù)載的處理需求明顯不同?!安捎枚鄠€(gè)嵌入式處理器的傳統(tǒng)ASIC計(jì)算機(jī)架構(gòu)無法提供許多新應(yīng)用所需的GOPS/mw/MHz,”Subramanian說?!靶枰⒁獾氖?,算法的復(fù)雜性遠(yuǎn)遠(yuǎn)超過了摩爾定律,因此,推動(dòng)了新的架構(gòu)。這些新架構(gòu)的編程模型是共同開發(fā)的,以便共同優(yōu)化編程模型和硬件架構(gòu)。”
這也在推動(dòng)大型數(shù)據(jù)中心架構(gòu)的發(fā)展?!癆rteris的Frank說:”我們看到超級(jí)計(jì)算機(jī)的核心數(shù)量會(huì)增加,因?yàn)樗鼈兊墓ぷ髫?fù)載,比如有限元和大的迭代系統(tǒng),很容易并行化?!?一切有大的線性代數(shù)工作負(fù)載的東西都在很好地?cái)U(kuò)展?!?/p>
CPU的局限性
雖然通用CPU很有用,但其通用性也是一個(gè)限制因素。“其中一個(gè)問題是,CPU并不是真的擅長(zhǎng)什么,”Frank說?!癈PU擅長(zhǎng)處理一個(gè)單線程,里面有很多決策。這就是為什么你有分支預(yù)測(cè)器,它們已經(jīng)是多年來研究的主題。但是加速器,尤其是定制加速器,服務(wù)于兩個(gè)領(lǐng)域。一個(gè)是你有很多數(shù)據(jù)在移動(dòng),CPU不擅長(zhǎng)處理這些數(shù)據(jù)。這里我們看到向量擴(kuò)展的范圍會(huì)更廣。還有很多操作是非常特殊的。如果你看神經(jīng)網(wǎng)絡(luò),你有非線性的閾值和巨大的矩陣乘法,用CPU做這些事情效率很低。所以人們?cè)噲D將工作負(fù)載移到靠近內(nèi)存的地方,或者移到專門的功能單元中?!?/p>
與處理器架構(gòu)緊密相連的是內(nèi)存?!皩?duì)于一些應(yīng)用來說,內(nèi)存帶寬限制了增長(zhǎng),”Mentor的Subramanian說?!皩S锰幚砥饕约皟?nèi)存(或接近內(nèi)存)計(jì)算機(jī)架構(gòu)增長(zhǎng)的關(guān)鍵原因之一,是為了直接解決傳統(tǒng)馮-諾依曼架構(gòu)的限制。尤其是當(dāng)如此多的能量在處理器之間移動(dòng)數(shù)據(jù),以及內(nèi)存與實(shí)際計(jì)算所花費(fèi)的能量時(shí),情況更是如此?!?/p>
數(shù)字中隱藏的另一件事是核心復(fù)雜性?!拔覀兛吹降氖牵m然集群保持不變,但單個(gè)內(nèi)核變得更加強(qiáng)大,”Synopsys的Willems說?!拔覀兛吹降氖悄承╊I(lǐng)域向64位發(fā)展的趨勢(shì)。從這個(gè)意義上說,同樣數(shù)量的核心,但能力更強(qiáng)。”
受軟件的限制
20多年前,PC從單核處理器轉(zhuǎn)為多核,然而能夠成功利用多核的應(yīng)用程序數(shù)量仍然有限?!叭绻憧纯茨隳軓囊粋€(gè)普通程序中提取多少并行性,你可以發(fā)現(xiàn)每時(shí)鐘周期大約兩條指令的并行性水平,”Frank說?!叭绻愀淖兡愕木幊棠P?,成為一個(gè)明確的數(shù)據(jù)流模型,在這個(gè)模型中,你有你管理的數(shù)據(jù)依賴性,你可以突然獲得13倍到20倍的性能提升?!?/p>
人類能做得更好嗎?“試著找一個(gè)能寫出能有效使用兩個(gè)線程的并行程序的程序員,”Frank補(bǔ)充道?!澳銜?huì)找到這些人的。試著找到一個(gè)人,當(dāng)你沒有高度并行的工作負(fù)載時(shí),可以使用四個(gè)以上的線程。非常困難。而且你想增加的線程越多,問題就越復(fù)雜,越難。”
面向數(shù)據(jù)的編程讓一切變得不同。“幾十年來,并行計(jì)算概念一直是計(jì)算機(jī)科學(xué)的一部分,但一直被歸為高度專業(yè)化的任務(wù),并行處理是很困難的,”Subramanian說?!霸谶^去的五到七年里,這種情況已經(jīng)發(fā)生了重大變化,以至于大規(guī)模的并行計(jì)算成為可能。這在當(dāng)今許多新的‘基于數(shù)據(jù)’的學(xué)科中尤為重要,在這些學(xué)科中,編程模型需要有效地使軟件算法能夠在非常大的并行計(jì)算架構(gòu)上運(yùn)行?,F(xiàn)在,它們正在被擴(kuò)展到異構(gòu)并行計(jì)算架構(gòu)上,我們看到新的工作負(fù)載的新的編程框架出現(xiàn)--Tensorflow、Caffe、MLpac、CUDA、Spark、MOA只是其中的幾個(gè)--以大大降低這些系統(tǒng)編程的障礙?!?/p>
進(jìn)展也發(fā)生在AI領(lǐng)域之外?!坝幸恍┚幊棠P?,或者編程語言,強(qiáng)制執(zhí)行編程模型,比如Cilk,一個(gè)基于任務(wù)的模型,”Frank說。“有一些運(yùn)行時(shí)庫(kù),支持像OpenMP任務(wù)模型這樣的東西。當(dāng)采用這些時(shí),你會(huì)突然發(fā)現(xiàn),你可以填滿10個(gè)處理器。因此,只要我們達(dá)到這個(gè)水平,以及這些類型的編程模型--基于任務(wù)的、數(shù)據(jù)依賴管理的程序模型--你就會(huì)發(fā)現(xiàn),處理器的增加會(huì)有下一步的發(fā)展。”
還有其他因素促使人們關(guān)注多核編程。“有些人是從功能安全或安全領(lǐng)域來看待多核的,”Mentor的Hancock說?!霸O(shè)計(jì)人員需要將多核隔離,或者說分離成各個(gè)子系統(tǒng),以便保護(hù)一些東西。然而,人們不愿意改變。你需要開拓者來引領(lǐng)潮流,可能要發(fā)生一些大事件。在這之前,他們傾向于建立在他們已經(jīng)知道的和舒適的基礎(chǔ)上。汽車業(yè)需要像特斯拉這樣的人去撼動(dòng)一切。傳統(tǒng)的汽車公司最初只是看到山谷里的一家創(chuàng)業(yè)公司,就把他們拒之門外。突然間,他們注意到了,并意識(shí)到自己需要做出改變?!?/p>
新驅(qū)動(dòng)程序
雖然智能手機(jī)仍然是銷量和美元的領(lǐng)頭羊,但它們不再是導(dǎo)致技術(shù)進(jìn)步的唯一細(xì)分市場(chǎng)?!捌噾?yīng)用中的計(jì)算正在經(jīng)歷一場(chǎng)令人難以置信的轉(zhuǎn)變,其驅(qū)動(dòng)力是對(duì)更沉浸式、更豐富的車內(nèi)體驗(yàn)的需求,不斷提高的安全和便利的自動(dòng)化水平,以及向軟件定義功能的發(fā)展,”Arm的Greenhalgh說?!斑@導(dǎo)致單個(gè)電子控制單元(ECU)迅速整合為更少的多功能ECU,這不僅需要以多核CPU的形式提供更多的CPU計(jì)算能力,還需要部署異構(gòu)計(jì)算元素。我們現(xiàn)在看到SoC的多核CPU越來越多,同時(shí)也得到了GPU、ISP和ML加速器的增強(qiáng),使得軟件可以部署到每個(gè)工作負(fù)載最有效的計(jì)算元素上。”
進(jìn)入汽車芯片的計(jì)算能力是驚人的?!摆厔?shì)肯定是朝著特定領(lǐng)域架構(gòu)、片上和片外加速器以及嵌入式可編程邏輯的方向發(fā)展,”O(jiān)neSpin Solutions的技術(shù)營(yíng)銷經(jīng)理Sergio Marchese說?!皩?duì)于許多應(yīng)用來說,把更多的標(biāo)準(zhǔn)處理器扔到一個(gè)問題上并不是最有效的解決方案。例如,如果你看看特斯拉全自動(dòng)駕駛芯片,它有12個(gè)Cortex-A72處理器,占據(jù)了很大一部分芯片面積。然而,兩個(gè)神經(jīng)網(wǎng)絡(luò)加速器占用的面積幾乎是它的兩倍?!?/p>
Cadence的Przywara對(duì)此表示贊同。“我們?cè)谄囶I(lǐng)域看到的用于支持自主汽車中更復(fù)雜的Level 2、Level 3的是多核DSP集群來支持雷達(dá),以及支持越來越復(fù)雜的AI算法的引擎。我們看到的例子是,由于所需的TOPS數(shù)量,可能多達(dá)8個(gè)以上的AI引擎被用來運(yùn)行AI算法?!?/span>
人工智能本身就是一個(gè)驅(qū)動(dòng)力?!皩?duì)于人工智能來說,它是關(guān)于如何處理內(nèi)存訪問和地址計(jì)算的問題,”Willems說?!拔覀兛吹搅撕芏嗷顒?dòng)和很多正在開發(fā)的處理器,這些處理器不是現(xiàn)成的那種處理器。有些系統(tǒng)會(huì)有多個(gè)AI處理器,只是因?yàn)樗鼈冇幸粋€(gè)始終在線的功能,它們需要處理一些事情,然后它們會(huì)喚醒另一個(gè)AI處理器來做一些更大規(guī)模的計(jì)算 所以,你可能會(huì)有多個(gè)處理器分配到任務(wù)?!?/span>
AI也在影響更小的邊緣設(shè)備,以及?!?a target="_blank">MCU正在承擔(dān)起進(jìn)行機(jī)器學(xué)習(xí)的能力,”Przywara說?!癟inyML正在幫助推動(dòng)這一點(diǎn)。這是他們傳統(tǒng)上沒有使用的東西,但隨著越來越多的人工智能和機(jī)器學(xué)習(xí)的應(yīng)用被研究和開發(fā)出來,這將成為MCU或所有產(chǎn)品變得更有能力的驅(qū)動(dòng)力。這將推動(dòng)這些設(shè)備中的處理核心數(shù)量越來越多的趨勢(shì)。”
5G也在產(chǎn)生相當(dāng)大的影響。“一個(gè)無線電調(diào)制解調(diào)器過去有一個(gè)大的大規(guī)模DSP,”Willems說?!八銐驈?qiáng)大,可以依次或交錯(cuò)運(yùn)行必要的任務(wù)。轉(zhuǎn)移到5G,很明顯,一個(gè)單一的DSP已經(jīng)無法完成工作。相反,他們把某些東西剝離出來,變成多個(gè)可編程加速器--一個(gè)DSP專門負(fù)責(zé)某些功能,比如做矩陣反轉(zhuǎn)或均衡。但它并不都是同一個(gè)DSP,也不是它的倍數(shù)。它是多個(gè)內(nèi)核,每個(gè)內(nèi)核由指令集和內(nèi)存接口專門化?!?/p>
基站的處理器增長(zhǎng)幅度更大?!皩?duì)于5G基站應(yīng)用,我們看到大量的核心接近近100個(gè)核心,來完成工作負(fù)載?!盤rzywara說?!?G,當(dāng)然是在基礎(chǔ)設(shè)施方面,將會(huì)把事情推高?!?/p>
未來發(fā)展
那么未來我們應(yīng)該期待什么呢?“會(huì)有更多的特殊處理器,”弗蘭克說。“在標(biāo)準(zhǔn)SoC領(lǐng)域,我預(yù)計(jì)處理器內(nèi)核數(shù)量會(huì)增加,可能會(huì)達(dá)到256個(gè)內(nèi)核,但不會(huì)用于PC、筆記本或手機(jī)。我們將看到的地方是針對(duì)汽車的嵌入式系統(tǒng),與機(jī)器學(xué)習(xí)方面相比,對(duì)高性能和連貫性的要求越來越高,變得更加重要?!?/p>
為了利用它,編程模式必須改變?!坝晒ぷ髫?fù)載能力和性能效率驅(qū)動(dòng)的新計(jì)算機(jī)架構(gòu)的ASIC數(shù)量正在快速增長(zhǎng),”Subramanian說。“對(duì)解決大量各種工作負(fù)載的解決方案的需求(如語音識(shí)別、X射線分析、物體檢測(cè)、面部識(shí)別、生物細(xì)胞的進(jìn)化)已經(jīng)在迫使計(jì)算分析的新領(lǐng)域的發(fā)展,開發(fā)新的數(shù)學(xué)模型來理解具體問題。而且它正在迅速地將這些發(fā)現(xiàn)帶入計(jì)算機(jī)科學(xué)的世界,特別是新計(jì)算機(jī)架構(gòu)性能的分析。這導(dǎo)致了計(jì)算機(jī)架構(gòu)世界正在向異構(gòu)、多處理架構(gòu)發(fā)展,并從馮-諾依曼向神經(jīng)形態(tài)計(jì)算架構(gòu)發(fā)展。我們今天剛剛開始了計(jì)算機(jī)架構(gòu)的復(fù)興。”
也許是時(shí)候重寫調(diào)查問題,以更好地反映芯片處理能力的演變。也許應(yīng)該確定獨(dú)立指令流的數(shù)量,或者控制線程的數(shù)量,但所有這樣的指標(biāo)將繼續(xù)偏向于今天的控制驅(qū)動(dòng)范式。
責(zé)任編輯:tzh
-
處理器
+關(guān)注
關(guān)注
68文章
20160瀏覽量
247722 -
芯片
+關(guān)注
關(guān)注
462文章
53598瀏覽量
459861 -
mcu
+關(guān)注
關(guān)注
147文章
18646瀏覽量
388370 -
soc
+關(guān)注
關(guān)注
38文章
4522瀏覽量
227754 -
AI
+關(guān)注
關(guān)注
90文章
38303瀏覽量
297373
發(fā)布評(píng)論請(qǐng)先 登錄
Solist?AI?:讓 MCU 擁有“現(xiàn)場(chǎng)學(xué)習(xí)能力”的邊緣智能方案
嵌入式應(yīng)掌握的幾種能力
MCU數(shù)據(jù)采集模塊的數(shù)據(jù)處理和分析能力如何?
N32H高性能32位MCU在具身機(jī)器人上的應(yīng)用
解讀基于凌鷗創(chuàng)芯MCU的割草機(jī)器人刀盤控制方案
芯品速遞 | 芯??萍?CS32F090:大容量高性價(jià)比MCU
使用MATLAB進(jìn)行無監(jiān)督學(xué)習(xí)
機(jī)器學(xué)習(xí)模型市場(chǎng)前景如何
嵌入式機(jī)器學(xué)習(xí)的應(yīng)用特性與軟件開發(fā)環(huán)境
MCU在車載系統(tǒng)中的展望
傳統(tǒng)機(jī)器學(xué)習(xí)方法和應(yīng)用指導(dǎo)

MCU正在承擔(dān)起進(jìn)行機(jī)器學(xué)習(xí)的能力?
評(píng)論