1. 內(nèi)存256KB設(shè)備也能人臉檢測(cè)!微軟提出用RNN代替CNN | NeurIPS 2020
Github:
https://github.com/microsoft/EdgeML/blob/master/pytorch/edgeml_pytorch/graph/rnnpool.py
https://github.com/microsoft/EdgeML/tree/master/examples/pytorch/vision
Paper:
https://www.microsoft.com/en-us/research/publication/rnnpool-efficient-non-linear-pooling-for-ram-constrained-inference/
為了讓更多IoT設(shè)備用上AI,在條件“簡(jiǎn)陋”的單片機(jī)上跑圖像識(shí)別模型也成為一種需求。
但是圖像識(shí)別對(duì)內(nèi)存有較高的要求,一般搭載MCU的設(shè)備內(nèi)存都不高,怎樣才能解決這個(gè)問(wèn)題呢?
最近,微軟提出了一種RNNPool方法,甚至可在內(nèi)存只有256 KB的STM32開(kāi)發(fā)板上運(yùn)行人臉檢測(cè)模型。它可以在不損失準(zhǔn)確度的情況下大幅降低激活圖的采樣率。
RNNPool在語(yǔ)法上等效于池化算子,可以快速減小中間圖的大小。它的模型層數(shù)更少,對(duì)內(nèi)存要求更低,可以在內(nèi)存受限的小型設(shè)備上分析圖像。
RNNPool由兩個(gè)學(xué)習(xí)遞歸神經(jīng)網(wǎng)絡(luò)(RNN)組成,它們以每個(gè)模塊為單個(gè)向量,在水平和垂直方向上掃過(guò)激活圖的每個(gè)模塊。
RNNPool獲取一個(gè)激活圖的模塊并將其匯總為1×1體素,然后逐步執(zhí)行下采樣步驟。RNNPool可以支持8×8,甚至16×16的模塊大小,并且可以以步長(zhǎng)s = 4或s = 8采樣,而不會(huì)顯著降低精度。
2. 1瓦功耗,5GHz頻率:全球最快Risc-V芯片出世,效率超越蘋果M1
根據(jù)全球半導(dǎo)體行業(yè)知名媒體 EE Times 的報(bào)道,前些天,一家位于加州森尼維爾的小型電子設(shè)計(jì)公司 Micro Magic 宣稱:他們?cè)O(shè)計(jì)、生產(chǎn)出了全世界最快的 64 位 RISC-V 內(nèi)核,比蘋果的 M1 芯片和 Arm Cortex-A9 表現(xiàn)還要出色。
Micro Magic 的聲明中提到,這款原型 CPU 在 1.1v 電壓下可以達(dá)到 5GHz 的時(shí)鐘速度,遠(yuǎn)高于運(yùn)行速度為 3.2GHz 的英特爾 Xeon 服務(wù)器芯片 E7,CoreMarks 跑分達(dá)到 13000 分。而 1.1 伏時(shí),該芯片只需要消耗 1 瓦的功率,不到英特爾 Xeon 功率的 1%。此外,單個(gè) Micro Magic 核心在 0.8V 下可以達(dá)到 4.25GHz,CoreMarks 跑分達(dá)到 11000 分,但消耗的功率僅為 200mW。
這款 RISC-V 芯片的速度和能效也超過(guò)了 Exynos 4。Exynos 4 是三星電子為其智能手機(jī)生產(chǎn)的頂級(jí)部件,基于 ARM Holdings Plc 提供的計(jì)算核心,是英特爾的主要競(jìng)爭(zhēng)對(duì)手。
這款芯片不僅在低功耗下速度更快,在基準(zhǔn)得分上也趕超英特爾和三星的芯片。在 CoreMark 基準(zhǔn)測(cè)試中,這款 RISC-V 芯片的得分為 13000 分,是基于 ARM 的 Exynos 單核性能得分的兩倍多。雖然英特爾 Xeon 名義上單核性能更高,達(dá)到 26009 分,但 Xeon 需要更多線程,120 個(gè)線程才能達(dá)到上述結(jié)果。
圖靈獎(jiǎng)獲得者,計(jì)算機(jī)體系結(jié)構(gòu)先驅(qū) David Patterson:「這真是太神奇了?!?/p>
3. VS Code竟然能約會(huì)!找對(duì)象不看臉,看編程水平
VS Code現(xiàn)在居然可以用來(lái)談戀愛(ài)了。
為了用最硬核的方式找到男(女)朋友,23歲的程序員Ben Awad在VS Code里打造一個(gè)約會(huì)軟件VSinder。
顧名思義,VSinder = VS Code + Tinder,就是把約會(huì)軟件集成到了代碼編輯器里,簡(jiǎn)直太對(duì)程序員胃口了。
VSinder和Tinder的操作邏輯一樣,左滑把不喜歡的人pass掉,右滑收藏喜歡的人。
這款插件一上線,就快速贏得程序員們的認(rèn)可,GitHub上已收獲800 Star,3天的下載量超過(guò)9000次。
既然是面向程序員的約會(huì)軟件,自然不能和其他約會(huì)App一樣,一定要有特色。
VSinder的特點(diǎn)就是,可以根據(jù)編程語(yǔ)言和代碼風(fēng)格篩選對(duì)象。
比如你用的是Python,她用的是C,那么你們之間可能沒(méi)有共同語(yǔ)言。(以免將來(lái)為哪種語(yǔ)言最好吵架。)
4. AI把特朗普變成了dancer,跟著蔡徐坤跳起了『雞你太美』
“好家伙!”
“現(xiàn)在的Paper也是越來(lái)越皮了”。正在開(kāi)心摸魚的同事,邊說(shuō)邊給我發(fā)過(guò)來(lái)一段Demo。
原來(lái)『寶藏男孩』特朗普又被玩壞了。
『被逼著』跟蔡徐坤跳起了“雞你太美”(諧音梗)。
逼著川寶大秀舞姿的是上海科技大學(xué)研究團(tuán)隊(duì)的最新AI,這篇AI論文名:
《Liquid Warping GAN with Attention:A Unified Frame work for Human Images Synthesis》
簡(jiǎn)單理解就是,基于特定框架的AI,能夠完成運(yùn)動(dòng)仿真、外觀轉(zhuǎn)換以及新視圖合成等人體圖像處理任務(wù)。上面特朗普的舞蹈Demo是AI合成的最終演示效果。
5. 57.3 AP!刷新COCO目標(biāo)檢測(cè)和實(shí)例分割新記錄!谷歌提出 Copy-Paste 大法
Paper:https://arxiv.org/abs/2012.07177
上個(gè)月,Scaled-YOLOv4剛剛刷新COCO 目標(biāo)檢測(cè)的新記錄:55.8% AP!
昨天該數(shù)據(jù)又雙叒叕被打破了!
谷歌拿下COCO目標(biāo)檢測(cè)和實(shí)例分割雙項(xiàng)第一名!其中:
目標(biāo)檢測(cè)數(shù)據(jù)刷到57.3 AP;
實(shí)例分割數(shù)據(jù)刷到49.1 AP!
本文主要?jiǎng)?chuàng)新點(diǎn):
1. Blending Pasted Objects
公式:I1 × α + I2 × (1 - α)
2. Large Scale Jittering
3. Self-training Copy-Paste
這三點(diǎn)其實(shí)很容易理解(不用翻譯,直接看懂),沒(méi)有花哨的處理,但實(shí)驗(yàn)證明漲點(diǎn)明顯!
6. Github Star 7.2K,超級(jí)好用的OCR數(shù)據(jù)合成與半自動(dòng)標(biāo)注工具,強(qiáng)烈推薦!
Github:
https://github.com/PaddlePaddle/PaddleOCR
OCR 方向的工程師,一定需要知道這個(gè) OCR 開(kāi)源項(xiàng)目:PaddleOCR。短短幾個(gè)月,累計(jì) Star 數(shù)量已超過(guò) 7.2K,頻頻登上 Github Trending 日榜月榜,稱它為 OCR 方向目前最火的 repo 絕對(duì)不為過(guò)。
10 月,發(fā)布 PP-OCR 算法,開(kāi)源 3.5M 超超輕量模型,再下 Paperswithcode 趨勢(shì)榜第一
12 月,它又帶來(lái)四大新發(fā)布與升級(jí),核心內(nèi)容先睹為快:
全新發(fā)布數(shù)據(jù)合成工具 Style-Text:可以批量合成大量與目標(biāo)場(chǎng)景類似的圖像,在多個(gè)場(chǎng)景驗(yàn)證,效果均提升 15% 以上。
全新發(fā)布半自動(dòng)數(shù)據(jù)標(biāo)注工具 PPOCRLabel:有了它數(shù)據(jù)標(biāo)注工作事半功倍,相比 labelimg 標(biāo)注效率提升 60% 以上,社區(qū)小規(guī)模測(cè)試,好評(píng)如潮。
多語(yǔ)言識(shí)別模型效果升級(jí):中文、英文、韓語(yǔ)、法語(yǔ)、德語(yǔ)、日文識(shí)別效果均優(yōu)于 EasyOCR。
PP-OCR 開(kāi)發(fā)體驗(yàn)再升級(jí):支持動(dòng)態(tài)圖開(kāi)發(fā)(訓(xùn)練調(diào)試更方便),靜態(tài)圖部署(預(yù)測(cè)效率更高),魚與熊掌可以兼得。
7. TensorFlow 2.4 正式發(fā)布!提供GPU支持的新功能,推出 tf.experimental.numpy
TensorFlow 2.4 正式發(fā)布!隨著對(duì)分布式訓(xùn)練和混合精度提供更多支持,加入新的 Numpy 前端及用于監(jiān)控和診斷性能瓶頸的工具,這個(gè)版本的亮點(diǎn)在于推出新功能,以及對(duì)性能和擴(kuò)展方面的增強(qiáng)。
TensorFlow 2.4 以 tf.experimental.numpy 形式,實(shí)驗(yàn)性引入了對(duì) NumPy API 子集的支持。您可借此模塊,運(yùn)行由 TensorFlow 加速的 NumPy 代碼。由于此 API 基于 TensorFlow 構(gòu)建而成,因此可支持訪問(wèn)所有 TensorFlow API,與 TensorFlow 實(shí)現(xiàn)無(wú)縫互操作,并會(huì)通過(guò)編譯和自動(dòng)矢量化開(kāi)展優(yōu)化。例如,TensorFlow ND 數(shù)組可以與 NumPy 函數(shù)進(jìn)行交互,同樣地,TensorFlow NumPy 函數(shù)也可以接受包括 tf.Tensor 和 np.ndarray 在內(nèi)的不同類型的輸入。
8. 保姆級(jí)教程: 個(gè)人深度學(xué)習(xí)工作站配置指南 | 稚暉@知乎
本文記錄了組裝深度學(xué)習(xí)工作站過(guò)程中的超詳細(xì)操作流程,文章分為
硬件篇
1.1 工作站配置選型
1.2 電腦組裝
系統(tǒng)篇 - Ubuntu20.04
DL開(kāi)發(fā)環(huán)境配置篇
工作站的維護(hù)
供有類似需求的同學(xué)作為參考。
責(zé)任編輯:lq
-
芯片
+關(guān)注
關(guān)注
460文章
52520瀏覽量
441051 -
微軟
+關(guān)注
關(guān)注
4文章
6686瀏覽量
105771 -
圖像識(shí)別
+關(guān)注
關(guān)注
9文章
527瀏覽量
39117
原文標(biāo)題:【20201218期AI簡(jiǎn)報(bào)】?jī)?nèi)存256KB設(shè)備也能人臉檢測(cè)!
文章出處:【微信號(hào):RTThread,微信公眾號(hào):RTThread物聯(lián)網(wǎng)操作系統(tǒng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
【Milk-V Duo S 開(kāi)發(fā)板免費(fèi)體驗(yàn)】人臉檢測(cè)測(cè)試(視頻)
【BPI-CanMV-K230D-Zero開(kāi)發(fā)板體驗(yàn)】AI 算法模型(人臉檢測(cè)、軀干檢測(cè)、車牌識(shí)別)
重磅更新 | HPM_SDK v1.10.0 發(fā)布

【BPI-CanMV-K230D-Zero開(kāi)發(fā)板體驗(yàn)】03 攝像頭調(diào)用+AI人臉檢測(cè)
【BPI-CanMV-K230D-Zero開(kāi)發(fā)板體驗(yàn)】人臉檢測(cè)、手勢(shì)識(shí)別、車牌識(shí)別
《DNESP32S3使用指南-IDF版_V1.6》第五十八章 人臉檢測(cè)實(shí)驗(yàn)
使用OpenVINO?模型的OpenCV進(jìn)行人臉檢測(cè),檢測(cè)到多張人臉時(shí),伺服電機(jī)和步入器電機(jī)都發(fā)生移動(dòng)是為什么?
AI MCU# GD32G553 TinyML 輕量級(jí)邊緣 AI 應(yīng)用的理想選擇

安信可AI人臉識(shí)別方案

STM8S103F3P3TR STM32F091VCH6微控制器 IC MCU 8K/256K Flash
探索三軸AI智能人臉跟蹤云臺(tái)的神奇驅(qū)動(dòng)方案
深度偽造人臉檢測(cè)項(xiàng)目

可穿戴設(shè)備氧飽和度 (SpO2) 測(cè)量應(yīng)用簡(jiǎn)報(bào)

可穿戴設(shè)備上的心電圖信號(hào)采集應(yīng)用簡(jiǎn)報(bào)

評(píng)論