chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于智能MCU的性能分析介紹

lC49_半導(dǎo)體 ? 來源:djl ? 2019-08-29 16:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著人工智能物聯(lián)網(wǎng)技術(shù)的發(fā)展,我們看到智能設(shè)備正在加速普及。我們的身邊,漸漸地有智能音箱、早教機器人、掃地機器人等新智能設(shè)備品類出現(xiàn),同時在智能工業(yè)、智能城市和智能零售等領(lǐng)域,智能化的腳步也在向前進(jìn)展。我們看到,在這樣的發(fā)展趨勢下,傳統(tǒng)的MCU芯片也在發(fā)生著深刻的變化,在向智能化的方向發(fā)展。

智能物聯(lián)網(wǎng)與MCU智能化

這一波人工智能的興起起源于大數(shù)據(jù)和深度學(xué)習(xí)。隨著互聯(lián)網(wǎng)的發(fā)展,人類社會產(chǎn)生了大量數(shù)據(jù),而大數(shù)據(jù)配合深度神經(jīng)網(wǎng)絡(luò)算法可以訓(xùn)練出一些精度極高的機器學(xué)習(xí)模型,從而能撬動人臉識別,自動駕駛語音識別等新應(yīng)用?;诖髷?shù)據(jù)的人工智能中,終端節(jié)點負(fù)責(zé)采集數(shù)據(jù)并且交給云端,云端服務(wù)器反復(fù)迭代訓(xùn)練高精度模型,并最終將這些模型部署到應(yīng)用中。應(yīng)當(dāng)說數(shù)據(jù)采集和模型訓(xùn)練的任務(wù)分別在終端和云端做目前得到了一致認(rèn)可,但是具體部署的機器學(xué)習(xí)模型在何處執(zhí)行在不同的應(yīng)用中卻有所不同。

有些應(yīng)用(如攝像頭內(nèi)容分析)的模型部署在云端,即終端把原始數(shù)據(jù)完全回傳給云端,云端在該數(shù)據(jù)上執(zhí)行深度學(xué)習(xí)模型的推理,之后把結(jié)果發(fā)回給終端,終端再根據(jù)云端的結(jié)果執(zhí)行相應(yīng)操作;而在自動駕駛等應(yīng)用中模型必須部署在終端,即終端收集到數(shù)據(jù)后在本地執(zhí)行深度學(xué)習(xí)模型的推理,并根據(jù)結(jié)果作出相應(yīng)動作。在智能工業(yè)等需要在終端執(zhí)行深度學(xué)習(xí)模型推理的場景,原來用來執(zhí)行相關(guān)動作的MCU就必須能夠支持這樣的深度學(xué)習(xí)推理計算,這也就是MCU的智能化。

關(guān)于智能MCU的性能分析介紹

通常來說,機器學(xué)習(xí)模型必須部署在終端執(zhí)行的理由包括傳輸帶寬、反應(yīng)延遲和安全性等。從傳輸帶寬來考慮,目前物聯(lián)網(wǎng)中節(jié)點分布在各種場景中,如果要把原始數(shù)據(jù)直接傳輸?shù)皆贫?,則帶寬開銷非常大,而且無線傳輸?shù)哪芰块_銷也不小。而如果在終端部署機器學(xué)習(xí)推理則可以省下帶寬的開銷,只需要有選擇性地把部分重要數(shù)據(jù)傳送到云端,而無需傳輸全部原始數(shù)據(jù)。

反應(yīng)延遲也是把深度學(xué)習(xí)部署在終端的重要理由。目前數(shù)據(jù)到云端的來回傳送時間通常在數(shù)百毫秒級,對于工業(yè)機器人等對于延遲有高要求的應(yīng)用來說無法滿足要求。即使在5G低延遲網(wǎng)絡(luò)下,無線網(wǎng)絡(luò)的可靠性對于智能工業(yè)等要求高可靠性的應(yīng)用來說也難以滿足需求,偶爾的高延遲甚至數(shù)據(jù)丟包都可能會造成要求即時反應(yīng)的機器發(fā)生問題,因此會傾向于選擇將深度學(xué)習(xí)推理的計算放在本地做。

最后,數(shù)據(jù)的安全性也是一個考量,對于一些敏感應(yīng)用來說將數(shù)據(jù)通過網(wǎng)絡(luò)傳送給云端服務(wù)器意味著存在著數(shù)據(jù)被入侵的風(fēng)險——如果黑客通過破解智能工廠與云端服務(wù)器的數(shù)據(jù)從而控制整個工廠將會給工廠帶來巨大損失——而如果把這些計算放在本地則會安全地多。

根據(jù)上述的場景,我們認(rèn)為需要執(zhí)行本地機器學(xué)習(xí)推理計算的MCU主要會運行在如下場景中:

-智能生產(chǎn),需要快速反應(yīng)且重視數(shù)據(jù)的安全性,如根據(jù)聲音識別機器故障等;

-小型機器人,沒有人會希望機器人一旦斷網(wǎng)就無法工作,如無人機,掃地機器人等;

-智能家電,如智能空調(diào)根據(jù)人的位置智能送風(fēng)等;

-智能可穿戴設(shè)備,如根據(jù)人體的生理信號給出相應(yīng)提示等。

隨著上述在終端部署執(zhí)行機器學(xué)習(xí)推理計算的需求,一些原來只負(fù)責(zé)執(zhí)行基本程序的MCU也必須要有能力能跑動機器學(xué)習(xí)推理計算。這對于MCU的挑戰(zhàn)在于算力,因為在這一波人工智能的浪潮中,訓(xùn)練好的模型所需要的計算量通常是數(shù)十萬次計算到數(shù)億次計算不等,如果需要實時執(zhí)行這些運算則MCU需要的算力將會比原來的MCU強幾個數(shù)量級。

另外,智能MCU對功耗和實時性也有很高要求,這就需要MCU設(shè)計能有相應(yīng)改變。目前,MCU正處于8位更新?lián)Q代到32位的過程中,我們預(yù)計在32位MCU的基礎(chǔ)上,智能化會成為下一個MCU的演進(jìn)方向。

關(guān)于智能MCU的性能分析介紹

智能化技術(shù)路徑一:整合加速器IP

目前MCU領(lǐng)域,ARM占據(jù)了領(lǐng)導(dǎo)者的地位,其IP占據(jù)了大量的市場份額。對于智能化MCU的興起,ARM自然也不會袖手旁觀,而是起到了推動者的作用,幫助MCU實現(xiàn)智能化。

ARM的Cortex系列架構(gòu)占據(jù)著32位MCU的主導(dǎo)位置,所以ARM推進(jìn)智能MCU的方法需要兼顧其Cortex架構(gòu),不能為了推智能化MCU結(jié)果把自己的命給革了。因此,ARM選擇的方法是給Cortex核搭配一個獨立的加速器IP,當(dāng)需要執(zhí)行機器學(xué)習(xí)相關(guān)算法時調(diào)用這個加速器IP去做計算,而當(dāng)做傳統(tǒng)操作時還是使用Cortex。

ARM的機器學(xué)習(xí)加速器系列產(chǎn)品即Project Trillium,其中包括了機器學(xué)習(xí)處理器(ML Processor),物體檢測處理器等硬件IP,同時還包括可以在這些加速器以及Cortex核和Mali GPU上最優(yōu)化執(zhí)行相關(guān)算法的軟件棧ARM NN。以ARM ML Processor為例(如下圖),其架構(gòu)包含了用于加速專用函數(shù)的加速引擎Fixed-function Engine,用于加速神經(jīng)網(wǎng)絡(luò)的可編程層引擎Programmable Layer Engine,片上內(nèi)存,用于控制加速器執(zhí)行的網(wǎng)絡(luò)控制單元以及用于訪問片外內(nèi)存的DMA。

ARM ML Processor是典型的加速器架構(gòu),它有自己的指令集,只能執(zhí)行和機器學(xué)習(xí)相關(guān)的運算加速而無法運行其他程序,因此必須搭配Cortex核才能發(fā)揮作用。ARM ML Processor可以最高實現(xiàn)4.6TOPS的算力,同時最高能效比可達(dá)3TOPS/W,性能實屬優(yōu)秀,對于算力需求不高的場合也可以通過降低運行速度來降低功耗,以滿足MCU的需求。

關(guān)于智能MCU的性能分析介紹

除了ARM之外,其他MCU巨頭也在紛紛布局AI加速器,其中意法半導(dǎo)體屬于技術(shù)領(lǐng)先的位置。在去年,意法發(fā)布了其用于超低功耗MCU的專用卷積神經(jīng)網(wǎng)絡(luò)加速器,代號為Orlando Project,在28nm FD-SOI上可以實現(xiàn)2.9TOPS/W的超高能效比,相信隨著技術(shù)和市場需求的進(jìn)一步需求將會轉(zhuǎn)為商用化。

應(yīng)該說目前基于專用機器學(xué)習(xí)加速器IP的智能MCU尚處于蓄勢待發(fā)階段。顧名思義,專用機器學(xué)習(xí)加速器通過專用化的設(shè)計實現(xiàn)了很高的能效比,然而這也限制了應(yīng)用范圍,只能加速一部分機器學(xué)習(xí)算法,而無法顧及通用性。

目前,機器學(xué)習(xí)加速器最主要的加速對象算法是神經(jīng)網(wǎng)絡(luò)算法,尤其是卷積神經(jīng)網(wǎng)絡(luò)。從技術(shù)上說,卷積神經(jīng)網(wǎng)絡(luò)在執(zhí)行過程中并行度高,存在加速空間,一個加速器相比傳統(tǒng)處理器往往能把神經(jīng)網(wǎng)絡(luò)的執(zhí)行速度和能效比提升幾個數(shù)量級。從人工智能的發(fā)展脈絡(luò)來看,這一波人工智能中最成功的應(yīng)用也是基于卷積神經(jīng)網(wǎng)絡(luò)的機器視覺應(yīng)用,因此大家都專注于卷積神經(jīng)網(wǎng)絡(luò)的加速也是順理成章。

然而,對于MCU來說,專注于卷積神經(jīng)網(wǎng)絡(luò)加速卻未必是一個最優(yōu)化的選擇。首先,MCU市場的應(yīng)用存在一定碎片化,而一個專用的加速器很難覆蓋多個應(yīng)用,因此對于習(xí)慣了設(shè)計標(biāo)準(zhǔn)化MCU并走量覆蓋許多個市場的半導(dǎo)體廠商來說是否使用專用化加速器是一個需要仔細(xì)考慮的選擇。換句話說,許多應(yīng)用中希望智能MCU能高效執(zhí)行基于非卷積神經(jīng)網(wǎng)絡(luò)的機器學(xué)習(xí)算法(例如SVM,決策樹等等),那么這些應(yīng)用就無法被一個專用的卷積神經(jīng)網(wǎng)絡(luò)加速器覆蓋到,而需要設(shè)計另外一套加速器。當(dāng)然,這對于IP商ARM來說不是件壞事,因為ARM可以快速提升其機器學(xué)習(xí)加速器的IP品類數(shù)量并從中獲利,但是對于半導(dǎo)體公司來說卻有些頭疼。

此外,卷積神經(jīng)網(wǎng)絡(luò)最成功的應(yīng)用是機器視覺,然而在MCU應(yīng)用中除了機器視覺之外還有許多其他應(yīng)用,甚至可以說智能MCU的應(yīng)用中機器視覺并非最大的市場,這也限制了只能處理卷積神經(jīng)網(wǎng)絡(luò)的專用加速器IP的市場。

智能化路徑二:處理器架構(gòu)改良

根據(jù)上面的討論,ARM因為之前使用Cortex核占領(lǐng)了MCU市場,因此其保留Cortex架構(gòu)不變并力推能搭配Cortex核使用的專用加速器IP也是必然的商業(yè)邏輯。然而,基于專用機器學(xué)習(xí)加速器IP的智能MCU在碎片化應(yīng)用中會遇到應(yīng)用覆蓋過窄的問題,這也就是為什么還存在第二條MCU智能化的技術(shù)路徑——改良處理器架構(gòu)。

處理器架構(gòu)改良意味著直接設(shè)計一個低功耗高算力的通用處理器,這樣就可以覆蓋幾乎所有MCU應(yīng)用,從而避免了專用加速器的通用性問題。當(dāng)然,在處理器設(shè)計中,往往需要從指令集開始全盤重新設(shè)計,因此需要很大的投入。

根據(jù)半導(dǎo)體行業(yè)的傳統(tǒng),從頭設(shè)計一套新的自有指令集往往是吃力而不討好,因為指令集的設(shè)計、驗證、可擴(kuò)展性考慮等等往往不是一個團(tuán)隊就能完成的,而是需要大量人長時間的努力。然而,最近隨著RISC-V開源指令集得到越來越多的認(rèn)可,使用基于RISC-V指令集去做新處理器架構(gòu)可以大大節(jié)省指令集和架構(gòu)開發(fā)的成本以及風(fēng)險。RISC-V指令集經(jīng)過開源社區(qū)的認(rèn)證,已經(jīng)證明非??孔V,可以無需從頭造輪子,而只需要把精力集中在需要改良的部分,因此在這個時間點做新處理器架構(gòu)可謂是正逢其時。

使用新架構(gòu)做智能MCU的代表公司是來自法國的初創(chuàng)公司Greenwaves Technologies。Greenwaves正是使用了基于RISC-V的指令集,同時在架構(gòu)上在MCU中也引入了多核的概念,通過多數(shù)據(jù)流(SIMD)的方式來加速人工智能算法中的并行計算,可謂是MCU架構(gòu)上的一個革新。

關(guān)于智能MCU的性能分析介紹

目前,Greenwaves的第一款產(chǎn)品GAP8已經(jīng)處于出樣階段。根據(jù)網(wǎng)站資料,GAP8擁有8個核,可以在數(shù)十毫瓦的功耗下實現(xiàn)8GOPS的算力,該算力已經(jīng)能滿足許多智能MCU的需求。更關(guān)鍵的是,由于GAP8使用的是多核通用處理器而非專用加速器去加速人工智能算法,因此其可以通用性非常好,可以覆蓋各種算法以及應(yīng)用。在應(yīng)用存在碎片化的MCU市場,這無疑是一個很大的優(yōu)勢。由于使用的是通用處理器,GAP8的能效比相對于ARM的專用加速器在特定的領(lǐng)域較弱,但是GAP8的通用性卻是ARM的專用加速器無法企及的。

另外值得指出的是,新處理器架構(gòu)和專用加速器并非水火不容,完全可以在使用新處理器架構(gòu)的同時集成一個專用加速器,從而使用專用加速器去加速特定的應(yīng)用,而使用通用化的新架構(gòu)處理器去處理高效處理其他應(yīng)用。這里專用與通用的選擇完全則很大程度上取決于市場的需求以及潛在的商業(yè)回報。

除了Greenwaves之外,瑞薩也推出了類似的新處理器架構(gòu)。與Greenwaves略有不同的是,瑞薩并不是做一個新的通用處理器架構(gòu),而是做了一個可配置的協(xié)處理器,該協(xié)處理器可以使用高級語言(如C/C++)編程,在不同的應(yīng)用場景可以配置為不同的架構(gòu),從而兼顧了通用性和專用性。瑞薩將該架構(gòu)稱作為動態(tài)可重構(gòu)處理器(Dynamic Reconfigurable Processor, DRP),該架構(gòu)之前已經(jīng)在瑞薩的視頻處理器中已經(jīng)得到了驗證,現(xiàn)在瑞薩準(zhǔn)備將該架構(gòu)也搬到MCU中,并將在今年十月正式發(fā)布第一代集成DRP的MCU。

關(guān)于智能MCU的性能分析介紹

結(jié)語

人工智能和物聯(lián)網(wǎng)的結(jié)合推進(jìn)了智能MCU概念。我們預(yù)計在未來幾年將會看到智能MCU的普及,而在智能MCU的兩條技術(shù)路徑之間選擇則不僅會影響MCU市場,更有可能會對于半導(dǎo)體生態(tài)造成深遠(yuǎn)影響——如果專用加速器IP獲勝,則ARM將繼續(xù)成為智能MCU的領(lǐng)導(dǎo)者,反之如果新架構(gòu)獲勝則ARM將會遇到強力的挑戰(zhàn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19896

    瀏覽量

    235277
  • 物聯(lián)網(wǎng)
    +關(guān)注

    關(guān)注

    2931

    文章

    46251

    瀏覽量

    392650
  • 人工智能
    +關(guān)注

    關(guān)注

    1807

    文章

    49029

    瀏覽量

    249569
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    基于雙核MCU提高系統(tǒng)性能

    1、背景介紹隨著各個行業(yè)朝著智能化方向的發(fā)展,嵌入式產(chǎn)品對能耗和效率的要求越來越苛刻。特別是在智能電網(wǎng)、工業(yè)和醫(yī)療等領(lǐng)域,一個產(chǎn)品的核心 MCU 處理器面臨多重挑戰(zhàn)。比如,一個自動化的
    發(fā)表于 07-04 07:49

    關(guān)于FPGAs的DSP性能分析

    關(guān)于FPGAs的DSP性能分析
    發(fā)表于 05-07 06:12

    關(guān)于智能芯片LC1813與LC1761的介紹

    關(guān)于智能芯片LC1813與LC1761的介紹
    發(fā)表于 05-10 06:17

    關(guān)于智能傳感器與現(xiàn)代汽車電子的簡要分析

    關(guān)于智能傳感器與現(xiàn)代汽車電子的簡要分析
    發(fā)表于 05-14 07:03

    介紹的是高性能MCU之人工智能物聯(lián)網(wǎng)應(yīng)用開發(fā)相關(guān)知識

    。本系列痞子衡給大家介紹的是高性能MCU之人工智能物聯(lián)網(wǎng)應(yīng)用開發(fā)相關(guān)知識?! 《髦瞧职雽?dǎo)體2017年開始推出的i.MX RT系列跨界處理器,這種高
    發(fā)表于 12-16 06:20

    介紹的是i.MX RTyyyy系列MCU性能

      大家好,我是痞子衡,是正經(jīng)搞技術(shù)的痞子。今天痞子衡給大家介紹的是飛思卡爾i.MX RTyyyy系列MCU性能。  在前面的文章 i.MXRTyyyy微控制器概覽 里,痞子衡給大家簡介過恩智浦
    發(fā)表于 02-22 06:06

    什么是MCU?MCU市場現(xiàn)狀分析

    本文首先介紹MCU的概念和分類,其次介紹MCU技術(shù)原理,最后對MCU市場現(xiàn)狀以及中國MCU發(fā)
    發(fā)表于 04-23 14:28 ?1w次閱讀

    關(guān)于恩智浦高性能智能攪拌機的技術(shù)介紹

    采用恩智浦的LPC MCU和NFC技術(shù)的高性能智能攪拌機
    的頭像 發(fā)表于 06-28 17:34 ?4928次閱讀

    關(guān)于RX系列MCU的特點性能介紹

    瑞薩電子RX系列MCU介紹
    的頭像 發(fā)表于 07-23 00:33 ?4119次閱讀

    關(guān)于MEMS的性能分析介紹

    “要在 MCU 上實現(xiàn)更多智能,需要使用更加便宜的傳感器,然后在這些傳感器傳回的信號上進(jìn)行更多處理?!盨ondrel 公司銷售副總裁 John Tinson 說,“如果你減少組件數(shù)量,你就會減少單位
    的頭像 發(fā)表于 09-04 16:37 ?3718次閱讀

    關(guān)于GD32 MCU性能分析和應(yīng)用介紹

    物聯(lián)網(wǎng)大會現(xiàn)場展示了基于GD32 MCU為主控的智能燈、網(wǎng)絡(luò)無線打印機、多功能手持云臺等最新智能硬件及終端爆品。均體現(xiàn)了物聯(lián)網(wǎng)系統(tǒng)所需關(guān)鍵技術(shù),即高性能移動計算技術(shù)、傳感器感知與控制技
    的頭像 發(fā)表于 10-22 14:13 ?9728次閱讀

    關(guān)于GD32 MCU助力IEC60730-1的性能分析介紹

    H)中,特別詳細(xì)介紹了新的關(guān)于微控制器(MCU)測試和診斷的方法,以確保自動系統(tǒng)的嵌入式控制硬件和軟件的安全性。
    的頭像 發(fā)表于 10-22 15:41 ?9480次閱讀
    <b class='flag-5'>關(guān)于</b>GD32 <b class='flag-5'>MCU</b>助力IEC60730-1的<b class='flag-5'>性能</b><b class='flag-5'>分析</b>和<b class='flag-5'>介紹</b>

    關(guān)于MCU工藝的介紹分析

    萬物互聯(lián)的時代,8位MCU不斷推陳出新,在工業(yè)控制、物聯(lián)網(wǎng)、汽車電子、消費類電子等諸多領(lǐng)域均得到了廣泛運用。根據(jù)市調(diào)機構(gòu)IHS預(yù)測,8位MCU市場持續(xù)增長,到2020年,全球8位MCU的市場規(guī)模將達(dá)67億美元,需求量將達(dá)到近17
    的頭像 發(fā)表于 10-17 15:03 ?9245次閱讀

    關(guān)于ROOBO在智能領(lǐng)域的分析介紹

    中國科技部創(chuàng)新發(fā)展司副巡視員吳向,中國信息通信研究院院長、中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟(籌)秘書長劉多分別發(fā)表致辭,解讀了《國務(wù)院關(guān)于印發(fā)新一代人工智能發(fā)展規(guī)劃的通知》的主旨,介紹了中國信
    的頭像 發(fā)表于 10-08 15:10 ?1212次閱讀

    性能MCU對比 MCU智能家居中的應(yīng)用

    隨著物聯(lián)網(wǎng)(IoT)技術(shù)的飛速發(fā)展,智能家居行業(yè)迎來了前所未有的發(fā)展機遇。在這一領(lǐng)域,微控制器單元(MCU)作為核心控制單元,扮演著至關(guān)重要的角色。高性能MCU和普通
    的頭像 發(fā)表于 11-11 14:51 ?1378次閱讀