如今,由于物聯(lián)網(wǎng)的興起造成了數(shù)據(jù)沖擊,對(duì)重要物聯(lián)網(wǎng)傳感器數(shù)據(jù)的處理越來(lái)越接近數(shù)據(jù)最初所在的位置,便有了對(duì)基于邊緣計(jì)算的機(jī)器學(xué)習(xí)技術(shù)的需求。這兩年,人工智能發(fā)展的主題已經(jīng)非常明確,就是落地應(yīng)用。在眾多的AI技術(shù)當(dāng)中,無(wú)論是上層的算法應(yīng)用,還是產(chǎn)品,最終都依賴于底層算力的保障,也就是AI芯片。
邊緣AI市場(chǎng)落地風(fēng)向
從去年起,邊緣AI市場(chǎng)已經(jīng)進(jìn)入爆發(fā)期,AIoT終端數(shù)量已經(jīng)超越智能手機(jī)。從AI落地的場(chǎng)景來(lái)看,AI芯片的兩大工作負(fù)載主要是數(shù)據(jù)訓(xùn)練和推理計(jì)算。其中,推理計(jì)算市場(chǎng)份額的增速正在趕超數(shù)據(jù)訓(xùn)練市場(chǎng)。
現(xiàn)在一個(gè)算法模型能做到僅僅2KB,性能表現(xiàn)卻超過(guò)4MB的神經(jīng)網(wǎng)絡(luò)算法。深度學(xué)習(xí)算法的微型化改變表明以GPT-3為代表的超大型模型并不適用于企業(yè)級(jí)市場(chǎng)。
在新的物聯(lián)網(wǎng)框架中,數(shù)據(jù)在設(shè)備本地就可以得到處理。這需要在底層芯片設(shè)計(jì)上就考慮好算法模型在不同場(chǎng)景中有限的部署條件,包括算力、功耗和硅片面積的分配。從單位算力的成本效用上看,推理計(jì)算更能代表企業(yè)級(jí)市場(chǎng)所需要的落地方向。
邊緣AI芯片落地挑戰(zhàn)
首先就是邊緣AI的場(chǎng)景呈多元化,不同場(chǎng)景對(duì)芯片的功耗和性能要求都有差異。而另一方面,碎片化場(chǎng)景的市場(chǎng)容量具有不確定性,需要在芯片研發(fā)的工程成本和收益之間取得平衡,這是所有芯片廠商都需要面對(duì)的考驗(yàn)。
高質(zhì)量數(shù)據(jù)的獲取同樣是一大難點(diǎn),即如何從大數(shù)據(jù)中篩選可靠的數(shù)據(jù)。大數(shù)據(jù)不意味著高質(zhì)量的數(shù)據(jù),在AI芯片上執(zhí)行深度學(xué)習(xí)任務(wù)需要硬件傳感器的持續(xù)優(yōu)化。
另外對(duì)于傳統(tǒng)客戶而言,除了智能產(chǎn)品的采購(gòu)成本外,還有使用成本。芯片的功耗,產(chǎn)品是否易于部署,都影響著AI的落地和推廣。芯片廠商如何根據(jù)不同的場(chǎng)景定制不同算力的芯片也是落地環(huán)節(jié)上的痛點(diǎn)。
目前邊緣AI芯片缺乏高可用的開(kāi)發(fā)平臺(tái),軟件編譯工具設(shè)計(jì)復(fù)雜,用戶的開(kāi)發(fā)和使用門檻偏高,但這些可預(yù)見(jiàn)都會(huì)在落地過(guò)程中不斷完善和迭代。
商用邊緣AI芯片
旭日系列
面向AIoT,地平線推出了旭日系列邊緣AI芯片。通過(guò)IC設(shè)計(jì)和軟件的共同努力,實(shí)現(xiàn)了性能、功耗、靈活性和成本之間的平衡。旭日2邊緣AI芯片采用BPU伯努利1.0 架構(gòu),可提供 4TOPS等效算力,對(duì)多類目標(biāo)進(jìn)行實(shí)時(shí)檢測(cè)和精準(zhǔn)識(shí)別。旭日2集成了Dual-Cortex A53,能高效支持多種主流AI任務(wù)。同時(shí)還支持EMCC、SPI Flash。
旭日3則是地平線推出的,主打低功耗和高性能的全新一代AIoT邊緣AI芯片。其集成了地平線最先進(jìn)的伯努利2.0架構(gòu)AI引擎( BPU),可提供5TOPS的等效算力。
新的BPU架構(gòu)極大提升了對(duì)先進(jìn)CNN網(wǎng)絡(luò)架構(gòu)的支持效果,以及極大降低了AI運(yùn)算對(duì)DDR帶寬的占用率。輔以地平線天工開(kāi)物AI開(kāi)發(fā)平臺(tái),極大簡(jiǎn)化算法開(kāi)發(fā)與部署過(guò)程,降低AI產(chǎn)品的落地成本。
伯努利2.0 BPU結(jié)構(gòu)下,DDR Utilization 呈5倍提升。先進(jìn)的ISP處理算法,使得在寬動(dòng)態(tài)、低照度場(chǎng)景下,也能得到1200 w pixel高質(zhì)量的圖像。旭日3可同時(shí)處理不同分辨率4 ~ 8個(gè)Camera Sensor的輸入,并支持多種圖像后處理,同時(shí)支持 H.264 / H.265 編解碼,性能達(dá)到4K@60fps 。

(旭日3)
勘智K210 /K510
第一代芯片勘智K210專門針對(duì)機(jī)器視覺(jué)任務(wù)設(shè)計(jì),浮點(diǎn)計(jì)算能力可以達(dá)到1.28TFLOPS,可以媲美嵌入式領(lǐng)域主流的開(kāi)發(fā)選擇。同時(shí),它的功耗只有0.3W,典型工作場(chǎng)景的功耗小于1W,單位算力功耗低,是一款非常經(jīng)濟(jì)的選擇。第二代勘智K510根據(jù)實(shí)際的落地情況和客戶反饋進(jìn)行升級(jí)。這款I(lǐng)P內(nèi)核重新進(jìn)行架構(gòu)設(shè)計(jì),實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)中不同層級(jí)對(duì)計(jì)算資源、存儲(chǔ)和帶寬的需求,并且提升數(shù)據(jù)的復(fù)用率,降低芯片功耗。
其次,針對(duì)數(shù)據(jù)獲取的速度和質(zhì)量,勘智K510配置了全新的視覺(jué)模組。與第一代芯片相比,K510在幀率和外設(shè)方面都有大幅優(yōu)化。每T算力幀率達(dá)到業(yè)內(nèi)領(lǐng)先水平。此外,K510還支持浮點(diǎn) BF16 計(jì)算,在不適合進(jìn)行模型量化的場(chǎng)景相比同類產(chǎn)品更具優(yōu)勢(shì)。

(Video subsystem示意圖)
小結(jié)
從長(zhǎng)遠(yuǎn)來(lái)看,邊緣AI芯片將把企業(yè)的物聯(lián)網(wǎng)應(yīng)用提升到一個(gè)全新的水平。由AI芯片推動(dòng)的智能設(shè)備將有助于擴(kuò)展現(xiàn)有市場(chǎng),同時(shí)改變制造、建筑、物流、農(nóng)業(yè)和能源等各行業(yè)的價(jià)值分配方式。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
熱點(diǎn)推薦
【今晚7點(diǎn)半】正點(diǎn)原子 x STM32:智能加速邊緣AI應(yīng)用開(kāi)發(fā)!今晚正點(diǎn)原子B站直播間等你
【聯(lián)合直播】正點(diǎn)原子 x STM32:智能加速邊緣AI應(yīng)用開(kāi)發(fā)!
一、直播介紹 隨著人工智能技術(shù)在邊緣計(jì)算
發(fā)表于 09-25 14:14
利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能
的框架小 10 倍,速度也快 10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文中,我們將介紹這對(duì)開(kāi)發(fā)人員意味著什么,以及使用 Neuton 模型如何改進(jìn)您的開(kāi)發(fā)和終端
發(fā)表于 08-31 20:54
AI 芯片浪潮下,職場(chǎng)晉升新契機(jī)?
單元)、FPGA(現(xiàn)場(chǎng)可編程門陣列)、ASIC(專用集成電路)以及神經(jīng)擬態(tài)芯片等幾大類。在職稱評(píng)審體系中,這些細(xì)分領(lǐng)域對(duì)應(yīng)著不同的專業(yè)方向。以東莞市工程系列人工智能專業(yè)職稱評(píng)審為例,其人工智能
發(fā)表于 08-19 08:58
AI 邊緣計(jì)算網(wǎng)關(guān):開(kāi)啟智能新時(shí)代的鑰匙?—龍興物聯(lián)
順暢地通向云端,實(shí)現(xiàn)設(shè)備與云端之間高效的數(shù)據(jù)傳輸與交互。通過(guò)融合先進(jìn)的邊緣計(jì)算和人工智能技術(shù),AI 邊緣計(jì)算網(wǎng)關(guān)能夠在靠近數(shù)據(jù)源的網(wǎng)絡(luò)邊緣,
發(fā)表于 08-09 16:40
挖到寶了!人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器
和生態(tài)體系帶到使用者身邊 ,讓我們?cè)诩夹g(shù)學(xué)習(xí)和使用上不再受制于人。
三、多模態(tài)實(shí)驗(yàn),解鎖AI全流程
它嵌入了2D視覺(jué)、深度視覺(jué)、機(jī)械手臂、語(yǔ)音識(shí)別、嵌入式傳感器等多種類AI模塊,涵蓋人工智能領(lǐng)
發(fā)表于 08-07 14:30
挖到寶了!比鄰星人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器!
和生態(tài)體系帶到使用者身邊 ,讓我們?cè)诩夹g(shù)學(xué)習(xí)和使用上不再受制于人。
三、多模態(tài)實(shí)驗(yàn),解鎖AI全流程
它嵌入了2D視覺(jué)、深度視覺(jué)、機(jī)械手臂、語(yǔ)音識(shí)別、嵌入式傳感器等多種類AI模塊,涵蓋人工智能領(lǐng)
發(fā)表于 08-07 14:23
超小型Neuton機(jī)器學(xué)習(xí)模型, 在任何系統(tǒng)級(jí)芯片(SoC)上解鎖邊緣人工智能應(yīng)用.
Neuton 是一家邊緣AI 公司,致力于讓機(jī)器 學(xué)習(xí)模型更易于使用。它創(chuàng)建的模型比競(jìng)爭(zhēng)對(duì)手的框架小10 倍,速度也快10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文
發(fā)表于 07-31 11:38
迅為RK3588開(kāi)發(fā)板Linux安卓麒麟瑞芯微國(guó)產(chǎn)工業(yè)AI人工智能
迅為RK3588開(kāi)發(fā)板Linux安卓麒麟瑞芯微國(guó)產(chǎn)工業(yè)AI人工智能
發(fā)表于 07-14 11:23
AI芯片:加速人工智能計(jì)算的專用硬件引擎
人工智能(AI)的快速發(fā)展離不開(kāi)高性能計(jì)算硬件的支持,而傳統(tǒng)CPU由于架構(gòu)限制,難以高效處理AI任務(wù)中的大規(guī)模并行計(jì)算需求。因此,專為AI優(yōu)化的芯片
邊緣AI的優(yōu)勢(shì)和技術(shù)基石
在萬(wàn)物皆可AI(人工智能)的今天,市場(chǎng)上幾乎每家企業(yè)都在宣稱自己的業(yè)務(wù)中有了AI成分。因此,將AI接入極靠近終端客戶的網(wǎng)絡(luò)邊緣也就沒(méi)什么懸念
開(kāi)售RK3576 高性能人工智能主板
芯片讓產(chǎn)品變得更加完美,被廣
泛的應(yīng)用到 AI 服務(wù)器、人臉支付設(shè)備、安防、醫(yī)療、交通、金融、工控、智慧教育、智能零售等
等 AI 智能
發(fā)表于 04-23 10:55
AI賦能邊緣網(wǎng)關(guān):開(kāi)啟智能時(shí)代的新藍(lán)海
的引入徹底改變了這一局面。通過(guò)在邊緣網(wǎng)關(guān)集成AI芯片和算法模型,使其具備了實(shí)時(shí)數(shù)據(jù)分析、智能決策和自主控制能力。在工業(yè)質(zhì)檢場(chǎng)景中,搭載AI算
發(fā)表于 02-15 11:41
人工智能和機(jī)器學(xué)習(xí)以及Edge AI的概念與應(yīng)用
與人工智能相關(guān)各種技術(shù)的概念介紹,以及先進(jìn)的Edge AI(邊緣人工智能)的最新發(fā)展與相關(guān)應(yīng)用。 人工智能和機(jī)器學(xué)習(xí)是現(xiàn)代科技的核心技術(shù) 人工智能
嵌入式和人工智能究竟是什么關(guān)系?
對(duì)人工智能應(yīng)用的實(shí)時(shí)響應(yīng)。與此同時(shí),嵌入式系統(tǒng)在邊緣計(jì)算和物聯(lián)網(wǎng)領(lǐng)域,也為人工智能的應(yīng)用提供了廣闊的空間。
在邊緣計(jì)算中,嵌入式系統(tǒng)能夠?qū)?/div>
發(fā)表于 11-14 16:39
RISC-V在AI領(lǐng)域的發(fā)展前景怎么樣?
隨著人工智能的不斷發(fā)展,現(xiàn)在的視覺(jué)機(jī)器人,無(wú)人駕駛等智能產(chǎn)品的不斷更新迭代,發(fā)現(xiàn)ARM占用很大的市場(chǎng)份額,推出的ARM Cortex M85性能也是杠杠的,不知道RISC-V在AI領(lǐng)域
發(fā)表于 10-25 19:13

國(guó)產(chǎn)邊緣AI芯片落地人工智能領(lǐng)域風(fēng)向
評(píng)論