chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何學(xué)習(xí)基于Tansformer的目標(biāo)檢測算法呢?

3D視覺工坊 ? 來源:3D視覺工坊 ? 2023-08-07 16:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

說到純視覺的自動駕駛方案,大家第一個想到的就是Tesla吧。的確,早在2021年,Tesla就已經(jīng)實現(xiàn)了純視覺的BEV檢測方案,而且效果非常好。

240e9aa2-32e1-11ee-9e74-dac502259ad0.png

細心的同學(xué)可能發(fā)現(xiàn)了,這套BEV方案中將相機空間的圖像轉(zhuǎn)換到BEV空間的核心組件就是Transformer。

Transformer來源于自然語言處理領(lǐng)域,首先被應(yīng)用于機器翻譯。后來,大家發(fā)現(xiàn)它在計算機視覺領(lǐng)域效果也很不錯,而且在各大排行榜上碾壓CNN網(wǎng)絡(luò)。

2435d4a0-32e1-11ee-9e74-dac502259ad0.png

目標(biāo)檢測領(lǐng)域中,視覺Transformer不僅可以實現(xiàn)2D檢測、3D檢測,還可以實現(xiàn)多模態(tài)檢測,BEV視角下的檢測,性能也非常出色。

245b52ac-32e1-11ee-9e74-dac502259ad0.png

因此,掌握Transformer相關(guān)知識和工程基礎(chǔ)成為了企業(yè)招聘算法工程師的一個技能要求點,也是簡歷上的一個很大的加分項。

然而,想要掌握基于Transformer的目標(biāo)檢測算法,有以下3個難點

理解Transformer背后的理論基礎(chǔ),比如自注意力機制(self-attention), 位置編碼(positional embedding),目標(biāo)查詢(object query)等等,網(wǎng)上的資料比較雜亂,不夠系統(tǒng),難以通過自學(xué)做到深入理解并融會貫通。

2475f544-32e1-11ee-9e74-dac502259ad0.png

掌握基于Transformer的目標(biāo)檢測算法的思路和創(chuàng)新點,一些Transformer論文涉及的新概念比較多,話術(shù)沒有那么通俗易懂,讀完論文仍然不理解算法的細節(jié)部分。

24a3cd02-32e1-11ee-9e74-dac502259ad0.png2

Transformer代碼不易看懂,因為作用機制與CNN有不少差別,所以完全理解代碼并實踐應(yīng)用需要花費很大功夫。

24c35ec4-32e1-11ee-9e74-dac502259ad0.png3

那么如何學(xué)習(xí)基于Tansformer的目標(biāo)檢測算法呢?

實踐部分

24d6a84e-32e1-11ee-9e74-dac502259ad0.png24fc84a6-32e1-11ee-9e74-dac502259ad0.png






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 計算機視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1709

    瀏覽量

    46784
  • 自動駕駛
    +關(guān)注

    關(guān)注

    790

    文章

    14323

    瀏覽量

    170710
  • Transformer
    +關(guān)注

    關(guān)注

    0

    文章

    151

    瀏覽量

    6524

原文標(biāo)題:Transformer在自動駕駛中的應(yīng)用前景怎么樣?

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    基于FPGA的SSD目標(biāo)檢測算法設(shè)計

    隨著人工智能的發(fā)展,神經(jīng)網(wǎng)絡(luò)正被逐步應(yīng)用于智能安防、自動駕駛、醫(yī)療等各行各業(yè)。目標(biāo)識別作為人工智能的一項重要應(yīng)用也擁有著巨大的前景,隨著深度學(xué)習(xí)的普及和框架的成熟,卷積神經(jīng)網(wǎng)絡(luò)模型的識別精度越來越高
    的頭像 發(fā)表于 07-10 11:12 ?902次閱讀
    基于FPGA的SSD<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測算法</b>設(shè)計

    【嘉楠堪智K230開發(fā)板試用體驗】K230機器視覺相關(guān)功能體驗

    畫圖 機器學(xué)習(xí)模型在通過攝像頭獲取圖像后,經(jīng)過處理輸入后,在輸出環(huán)節(jié)通常還需要進行后處理,例如圖像檢測應(yīng)用中,目標(biāo)位置的框選等。 在K230中提供了畫圖的功能,可以實現(xiàn)畫線段、畫矩形、畫圓、畫箭頭
    發(fā)表于 07-08 17:25

    基于RK3576開發(fā)板的車輛檢測算法

    車輛檢測是一種基于深度學(xué)習(xí)的對人進行檢測定位的目標(biāo)檢測,能廣泛的用于園區(qū)管理、交通分析等多種場景,是違停識別、堵車識別、車流統(tǒng)計等多種
    的頭像 發(fā)表于 05-08 17:34 ?915次閱讀
    基于RK3576開發(fā)板的車輛<b class='flag-5'>檢測算法</b>

    基于RK3576開發(fā)板的安全帽檢測算法

    安全帽佩戴檢測是工地、生產(chǎn)安全、安防的重中之重,但人為主觀檢測的方式時效性差且不能全程監(jiān)控。AI技術(shù)的日漸成熟催生了安全帽佩戴檢測方案,成為了監(jiān)督佩戴安全帽的利器。本安全帽檢測算法是一
    的頭像 發(fā)表于 05-08 16:59 ?1586次閱讀
    基于RK3576開發(fā)板的安全帽<b class='flag-5'>檢測算法</b>

    基于RK3576開發(fā)板的人員檢測算法

    展示了RK3576開發(fā)板的人員檢測算法例程及API說明
    的頭像 發(fā)表于 05-07 17:33 ?302次閱讀
    基于RK3576開發(fā)板的人員<b class='flag-5'>檢測算法</b>

    基于RV1126開發(fā)板的車輛檢測算法開發(fā)

    車輛檢測是一種基于深度學(xué)習(xí)的對人進行檢測定位的目標(biāo)檢測,能廣泛的用于園區(qū)管理、交通分析等多種場景,是違停識別、堵車識別、車流統(tǒng)計等多種
    的頭像 發(fā)表于 04-14 16:00 ?300次閱讀
    基于RV1126開發(fā)板的車輛<b class='flag-5'>檢測算法</b>開發(fā)

    基于RV1126開發(fā)板的吸煙檢測算法開發(fā)

    吸煙檢測是一種基于深度學(xué)習(xí)的對抽煙人群進行檢測定位的目標(biāo)檢測,能廣泛的用于安防、生產(chǎn)安全、園區(qū)管理等多種場景。配合攝像頭,實時識別監(jiān)控區(qū)內(nèi)人
    的頭像 發(fā)表于 04-14 15:37 ?302次閱讀
    基于RV1126開發(fā)板的吸煙<b class='flag-5'>檢測算法</b>開發(fā)

    基于RV1126開發(fā)板的安全帽檢測算法開發(fā)

    安全帽佩戴檢測是工地、生產(chǎn)安全、安防的重中之重,但人為主觀檢測的方式時效性差且不能全程監(jiān)控。AI技術(shù)的日漸成熟催生了安全帽佩戴檢測方案,成為了監(jiān)督佩戴安全帽的利器。本安全帽檢測算法是一
    的頭像 發(fā)表于 04-14 15:10 ?291次閱讀
    基于RV1126開發(fā)板的安全帽<b class='flag-5'>檢測算法</b>開發(fā)

    基于RV1126開發(fā)板的火焰檢測算法開發(fā)

    火焰檢測是一種基于深度學(xué)習(xí)的對火焰進行檢測定位的目標(biāo)檢測?;诖笠?guī)模火焰數(shù)據(jù)識別訓(xùn)練,配合攝像頭,實時識別監(jiān)控區(qū)內(nèi)明火情況立刻發(fā)出警報,提醒
    的頭像 發(fā)表于 04-14 14:53 ?332次閱讀
    基于RV1126開發(fā)板的火焰<b class='flag-5'>檢測算法</b>開發(fā)

    基于RV1126開發(fā)板的人臉檢測算法開發(fā)

    在RV1126上開發(fā)人臉檢測算法組件
    的頭像 發(fā)表于 04-14 10:19 ?330次閱讀
    基于RV1126開發(fā)板的人臉<b class='flag-5'>檢測算法</b>開發(fā)

    軒轅智駕紅外目標(biāo)檢測算法在汽車領(lǐng)域的應(yīng)用

    在 AI 技術(shù)蓬勃發(fā)展的當(dāng)下,目標(biāo)檢測算法取得了重大突破,其中紅外目標(biāo)檢測算法更是在汽車行業(yè)掀起了波瀾壯闊的變革,從根本上重塑著汽車的安全性能、駕駛體驗與產(chǎn)業(yè)生態(tài)。
    的頭像 發(fā)表于 03-27 15:55 ?435次閱讀

    睿創(chuàng)微納推出新一代目標(biāo)檢測算法

    隨著AI技術(shù)的發(fā)展,目標(biāo)檢測算法也迎來重大突破。睿創(chuàng)微納作為熱成像領(lǐng)軍者,憑借深厚的技術(shù)積累與創(chuàng)新能力,結(jié)合AI技術(shù)推出新一代目標(biāo)檢測算法,以三大核心技術(shù)帶來AI視覺感知全場景解決方案
    的頭像 發(fā)表于 03-20 13:49 ?441次閱讀

    采用華為云 Flexus 云服務(wù)器 X 實例部署 YOLOv3 算法完成目標(biāo)檢測

    一、前言 1.1 開發(fā)需求 這篇文章講解:?采用華為云最新推出的 Flexus 云服務(wù)器 X 實例部署 YOLOv3 算法,完成圖像分析、目標(biāo)檢測。 隨著計算機視覺技術(shù)的飛速發(fā)展,深度學(xué)習(xí)
    的頭像 發(fā)表于 01-02 12:00 ?545次閱讀
    采用華為云 Flexus 云服務(wù)器 X 實例部署 YOLOv3 <b class='flag-5'>算法</b>完成<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測</b>

    NPU與機器學(xué)習(xí)算法的關(guān)系

    緊密。 NPU的起源與特點 NPU的概念最早由谷歌在其TPU(Tensor Processing Unit)項目中提出,旨在為TensorFlow框架提供專用的硬件加速。NPU的設(shè)計目標(biāo)是提高機器學(xué)習(xí)算法的運行效率,特別是在處理
    的頭像 發(fā)表于 11-15 09:19 ?1230次閱讀

    在樹莓派上部署YOLOv5進行動物目標(biāo)檢測的完整流程

    目標(biāo)檢測在計算機視覺領(lǐng)域中具有重要意義。YOLOv5(You Only Look One-level)是目標(biāo)檢測算法中的一種代表性方法,以其高效性和準(zhǔn)確性備受關(guān)注,并且在各種
    的頭像 發(fā)表于 11-11 10:38 ?3731次閱讀
    在樹莓派上部署YOLOv5進行動物<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測</b>的完整流程