chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

讓小機器具備視覺和聽覺功能,面臨哪些挑戰(zhàn)?

jf_pJlTbmA9 ? 來源:jf_pJlTbmA9 ? 作者:jf_pJlTbmA9 ? 2023-07-13 15:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

飛行汽車、機器人管家……在一些未來暢想中,今天的人們已經(jīng)擁有了各式“智慧”產(chǎn)品。如果運氣不好的話,高智能機器人大行其道,開始起來反抗人類,再現(xiàn)《機械公敵》劇情。雖然這些想象并未成真,但在當下,人工智能(AI)技術(shù)已經(jīng)走進了人們的世界。比如,每當給Alexa智能音箱指令時,機器學習技術(shù)都會努力弄清話語內(nèi)容,并試圖做出最佳判斷。每次Netflix或亞馬遜推薦了“下一部電影”或“下一次購貨商品”時,均是基于復雜機器學習算法而定向推薦,讓這些推薦遠比之前的促銷看上去誘人。盡管自動駕駛汽車尚未普及,但人們紛紛意識到自主導航的潛力和趨勢。

人工智能技術(shù)大有前途——它讓機器可以根據(jù)周圍的世界做出決策,像人一樣處理信息,甚至處理方式還會優(yōu)于人類。但是,如果細想上述事例,便會發(fā)現(xiàn)目前的很多人工智能,只能通過“大型機器”來實現(xiàn)——這些機器發(fā)熱量高、擁有線路功耗、體積巨大,而且昂貴。像Alexa和Netflix依靠云端的大型、高耗電服務(wù)器來分析用戶的意圖。而自動駕駛汽車則要依賴電池供電,考慮到電池必須能夠驅(qū)動車輪和轉(zhuǎn)向,因此需要提供很高的容量,與非常昂貴的人工智能決策相比,同樣也要消耗大量能源。

目前,人工智能技術(shù)穩(wěn)步發(fā)展,但是人工智能的“小型化,邊緣化”卻明顯滯后。那些由小型電池供電或存在成本和尺寸限制的設(shè)備無法實現(xiàn)機器的視覺和聽覺分析功能。目前,這些小型機器只能利用簡單的人工智能技術(shù):也許只是聽一個關(guān)鍵詞,或者分析低維信號,比如用光容積描記術(shù)(PPG)來測量心率。

如果小型機器有視覺和聽覺功能會怎么樣?

事實上,小型設(shè)備一旦能夠看到和聽到,是否有實用價值呢?思考一下,像門鈴攝像頭這樣的小產(chǎn)品需要使用自動駕駛或自然語言處理等高階人工智能技術(shù)嗎?似乎也沒有必要。因此可以考慮采用不太復雜、處理強度不大的小型化的、邊緣的人工智能計算,比如詞匯識別、語音識別和圖像分析。

普通的門鈴攝像頭和消費類安保攝像頭經(jīng)常會被一些無關(guān)緊要的事件觸發(fā),比如刮風引起的植物擺動、云彩引起的劇烈光線變化、甚至是狗或貓在攝像頭前跑動。這些事件可能會導致誤觸發(fā),從而需要房主去操作忽視并清除此類觸發(fā)事件。尤其糟糕的是,如果房主正好在世界其它地方旅行,而家里的攝像頭卻對日出、云彩、日落造成的光線變化發(fā)出了誤警報會影響他們睡眠和旅行。但一個智能攝像頭卻能夠基于更具體的事件進行觸發(fā),例如在所監(jiān)控的畫面中出現(xiàn)了一個人。

門鎖或其它出入口可使用面部識別,甚至是語音識別來授予人員訪問權(quán)限,在某些情況下不需要鑰匙或胸卡。

很多攝像頭都希望在發(fā)生某些特定事件時才觸發(fā):例如,跟蹤攝像頭可能希望在畫面中出現(xiàn)鹿時被觸發(fā),安保攝像頭可能希望在畫面中有人或出現(xiàn)開門或腳步聲等噪音時被觸發(fā),而個人攝像頭可能希望通過語音命令來觸發(fā)。

雖然有很多“Hey Alexa”這樣的簡單解決方案,但多詞匯量命令在很多應(yīng)用中都非常有用。如果具備識別20個或更多單詞的詞匯表,就可以在工業(yè)設(shè)備、家居自動化、烹飪設(shè)備和大量其它設(shè)備中應(yīng)用,以簡化人機交互。

盡管這些例子只觸及表層:讓小型機器看到、聽到和解決過去需要人為干預的問題,但實際上這是一種顛覆性思路,因為人們每天都不斷發(fā)現(xiàn)可智能化創(chuàng)造的新場景。

讓小機器具備視覺和聽覺功能,面臨哪些挑戰(zhàn)?

既然人工智能對小型機器具有如此實用價值,為何沒有被大量開發(fā)呢?答案是受限于算力。人工智能推理是神經(jīng)網(wǎng)絡(luò)模型計算的結(jié)果??梢园焉窠?jīng)網(wǎng)絡(luò)模型看作是大腦處理圖像或聲音的粗略近似形態(tài),將其分解為非常小的片段,然后在這些小碎片組合在一起時識別出模型?,F(xiàn)代化視覺問題的主要模型是卷積神經(jīng)網(wǎng)絡(luò)(CNN)。這類模型在圖像分析方面非常出色,在音頻分析方面也非常有用。問題在于,這些模型需要數(shù)百萬或數(shù)十億次的數(shù)學計算。對于傳統(tǒng)硬件設(shè)計,這些應(yīng)用在實施時卻會面臨一些困難抉擇:

使用低成本、低功耗的微控制器解決方案。雖然平均功耗可能很低,但卷積神經(jīng)網(wǎng)絡(luò)可能需要幾秒鐘時間來計算,這意味著人工智能推理不是實時的,并會消耗大量的電池電量。

購置一個昂貴的高性能處理器,能在規(guī)定延遲內(nèi)完成這些數(shù)學運算。不過,這些處理器通常很大,需要很多外部組件,包括散熱器或類似的冷卻組件。好處是,它們執(zhí)行人工智能推理的速度非???。

低功耗微控制器解決方案的速度太慢,無法發(fā)揮作用,而高性能處理器方法會超出成本、尺寸和電源預算,可以說上述兩種方案都不夠理想,難以實施。

由此可見,人們需要的是一種全新的嵌入式人工智能解決方案,盡可能減少卷積神經(jīng)網(wǎng)絡(luò)計算所需的能耗。人工智能推理需要以比傳統(tǒng)微控制器或處理器解決方案更少的能量來執(zhí)行,并且無需借助能耗高、尺寸大、成本大的外部組件(如存儲器)。如果人工智能推理解決方案實際上能夠消除機器視覺的能量損失,那么即便是最小的設(shè)備也能看到并識別周圍世界發(fā)生的事情。

幸運的是,人們現(xiàn)在已經(jīng)處于這場“小型機器”革命的開端。目前,ADI已經(jīng)在市場上推出了相關(guān)產(chǎn)品,能夠消除人工智能推理的能源成本,并實現(xiàn)電池供電的機器視覺功能。了解更多有關(guān)構(gòu)建能夠執(zhí)行人工智能推理但能耗卻只有微焦耳的微控制器的信息。

責任編輯:彭菁

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1813

    文章

    49774

    瀏覽量

    261771
  • 機器學習
    +關(guān)注

    關(guān)注

    66

    文章

    8541

    瀏覽量

    136260
  • 邊緣計算
    +關(guān)注

    關(guān)注

    22

    文章

    3477

    瀏覽量

    52737
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    RK3576機器人核心:三屏異顯+八路攝像頭,重塑機器人交互與感知

    更多"、"互動更流暢"是開發(fā)者面臨的核心挑戰(zhàn)。傳統(tǒng)的單一屏幕和有限的視覺輸入已成為提升機器人智能化水平的瓶頸。而瑞芯微RK3576高性能處理器的出現(xiàn)
    發(fā)表于 10-29 16:41

    什么是機器視覺及其功能

    機器視覺本質(zhì)上是一個系統(tǒng)(例如一臺計算機)查看的能力。系統(tǒng)通過該能力分析圖像,然后作出決策或進行分類。
    的頭像 發(fā)表于 09-10 17:23 ?610次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>視覺</b>及其<b class='flag-5'>功能</b>?

    再掀語音交互革命,廣和通AI解決方案加速機器聽覺進化

    機器人世界里,感知是智能化的第一步,是機器人獲取環(huán)境信息,學習適應(yīng)并自主決策的前提。聽覺作為五感之一,深度融合AI,可幫助機器人實現(xiàn)高效感知、數(shù)據(jù)獲取、語音交互和環(huán)境事件檢測,使
    的頭像 發(fā)表于 08-26 17:44 ?644次閱讀

    機器視覺系統(tǒng)工業(yè)相機的成像原理及如何選型

    機器視覺系統(tǒng)是一種模擬人類視覺功能,通過光學裝置和非接觸式傳感器獲取圖像數(shù)據(jù),并進行分析和處理,以實現(xiàn)對目標物體的識別、測量、檢測和定位等功能
    的頭像 發(fā)表于 08-07 14:14 ?1042次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>視覺</b>系統(tǒng)工業(yè)相機的成像原理及如何選型

    FOPLP工藝面臨挑戰(zhàn)

    FOPLP 技術(shù)目前仍面臨諸多挑戰(zhàn),包括:芯片偏移、面板翹曲、RDL工藝能力、配套設(shè)備和材料、市場應(yīng)用等方面。
    的頭像 發(fā)表于 07-21 10:19 ?1174次閱讀
    FOPLP工藝<b class='flag-5'>面臨</b>的<b class='flag-5'>挑戰(zhàn)</b>

    一文帶你了解什么是機器視覺網(wǎng)卡

    機器視覺網(wǎng)卡通常指的是在機器視覺系統(tǒng)中用于連接工業(yè)相機到計算機的以太網(wǎng)卡。它的核心作用是實現(xiàn)高速、穩(wěn)定、低延遲的圖像數(shù)據(jù)傳輸。以下是關(guān)于機器
    的頭像 發(fā)表于 07-09 16:18 ?427次閱讀
    一文帶你了解什么是<b class='flag-5'>機器</b><b class='flag-5'>視覺</b>網(wǎng)卡

    明遠智睿SSD2351開發(fā)板:語音機器人領(lǐng)域的變革力量

    的四核1.4GHz處理器具備強勁的運算性能,能夠高效處理語音機器人運行過程中的復雜任務(wù)。語音識別和合成需要大量的計算資源,該處理器可以快速對語音信號進行分析、處理和轉(zhuǎn)換。在實時語音交互場景中,無論是
    發(fā)表于 05-28 11:36

    機器視覺助力軌道缺陷檢測

    機器視覺檢測助力軌道檢測
    的頭像 發(fā)表于 05-21 16:55 ?609次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>視覺</b>助力軌道缺陷檢測

    智能軟件+硬件解決方案克服實時立體視覺中的挑戰(zhàn)

    現(xiàn)出色,特別適用于工業(yè)機器人應(yīng)用。從料箱撿取到自主導航,立體視覺使得各種機器人應(yīng)用成為可能。然而,在實時應(yīng)用場景中部署立體視覺系統(tǒng)時,常常面臨
    的頭像 發(fā)表于 05-16 17:04 ?484次閱讀
    智能軟件+硬件解決方案克服實時立體<b class='flag-5'>視覺</b>中的<b class='flag-5'>挑戰(zhàn)</b>

    【「# ROS 2智能機器人開發(fā)實踐」閱讀體驗】視覺實現(xiàn)的基礎(chǔ)算法的應(yīng)用

    結(jié)合IMU(慣性測量單元)進行多傳感器融合。 三、總結(jié)與展望 技術(shù)融合趨勢 機器視覺與SLAM的結(jié)合(如視覺慣性里程計VIO)是當前研究熱點,未來可能進一步結(jié)合語義SLAM,
    發(fā)表于 05-03 19:41

    智慧路燈的推廣面臨哪些挑戰(zhàn)

    引言 在智慧城市建設(shè)的宏偉藍圖中,叁仟智慧路燈的推廣面臨哪些挑戰(zhàn)?叁仟智慧路燈作為重要的基礎(chǔ)設(shè)施,承載著提升城市照明智能化水平、實現(xiàn)多功能集成服務(wù)的使命。然而,盡管叁仟智慧路燈前景廣闊,在推廣過程中
    的頭像 發(fā)表于 03-27 17:02 ?531次閱讀

    德晟達高性能服務(wù)器助力工業(yè)機器視覺落地

    當前工業(yè)機器視覺技術(shù)正經(jīng)歷深度變革,其應(yīng)用場景已從傳統(tǒng)質(zhì)量檢測、自動化生產(chǎn)逐步延伸至機器人導航、醫(yī)療影像分析等高端領(lǐng)域。隨著技術(shù)迭代升級,行業(yè)面臨三大核心
    的頭像 發(fā)表于 03-11 17:22 ?982次閱讀

    DLP160CP DMD是否可以應(yīng)用于機器視覺應(yīng)用?

    關(guān)于DLP160CPDMD芯片有一個疑問, 請問該芯片是否可以應(yīng)用在機器3D視覺(結(jié)構(gòu)光)場景應(yīng)用呢?我在TI TLP機器視覺,“3D掃描視覺
    發(fā)表于 02-20 07:39

    【「具身智能機器人系統(tǒng)」閱讀體驗】2.具身智能機器人的基礎(chǔ)模塊

    智能計算系統(tǒng)的軟件棧和硬件平臺,以及目前面臨的問題,還提到了為什么相比于自能駕駛,具身智能為什么發(fā)展比較慢,因為具身智能更加復雜,需要大算力,高實時性,高并發(fā)還需要低功耗,目前還面臨諸多的挑戰(zhàn)。相信借助
    發(fā)表于 01-04 19:22

    【「具身智能機器人系統(tǒng)」閱讀體驗】+初品的體驗

    動態(tài)互動的。 該理論強調(diào)智能行為源于智能體的物理存在和行為能力,智能體必須具備感知環(huán)境并在其中執(zhí)行任務(wù)的能力。具身智能的實現(xiàn)涵蓋了機器學習、人工智能、機器人學、計算機視覺、自然語言處理
    發(fā)表于 12-20 19:17