說到純視覺的自動(dòng)駕駛方案,大家第一個(gè)想到的就是Tesla吧。的確,早在2021年,Tesla就已經(jīng)實(shí)現(xiàn)了純視覺的BEV檢測(cè)方案,而且效果非常好。

細(xì)心的同學(xué)可能發(fā)現(xiàn)了,這套BEV方案中將相機(jī)空間的圖像轉(zhuǎn)換到BEV空間的核心組件就是Transformer。
Transformer來源于自然語言處理領(lǐng)域,首先被應(yīng)用于機(jī)器翻譯。后來,大家發(fā)現(xiàn)它在計(jì)算機(jī)視覺領(lǐng)域效果也很不錯(cuò),而且在各大排行榜上碾壓CNN網(wǎng)絡(luò)。

目標(biāo)檢測(cè)領(lǐng)域中,視覺Transformer不僅可以實(shí)現(xiàn)2D檢測(cè)、3D檢測(cè),還可以實(shí)現(xiàn)多模態(tài)檢測(cè),BEV視角下的檢測(cè),性能也非常出色。

因此,掌握Transformer相關(guān)知識(shí)和工程基礎(chǔ)成為了企業(yè)招聘算法工程師的一個(gè)技能要求點(diǎn),也是簡(jiǎn)歷上的一個(gè)很大的加分項(xiàng)。
然而,想要掌握基于Transformer的目標(biāo)檢測(cè)算法,有以下3個(gè)難點(diǎn):
理解Transformer背后的理論基礎(chǔ),比如自注意力機(jī)制(self-attention), 位置編碼(positional embedding),目標(biāo)查詢(object query)等等,網(wǎng)上的資料比較雜亂,不夠系統(tǒng),難以通過自學(xué)做到深入理解并融會(huì)貫通。
掌握基于Transformer的目標(biāo)檢測(cè)算法的思路和創(chuàng)新點(diǎn),一些Transformer論文涉及的新概念比較多,話術(shù)沒有那么通俗易懂,讀完論文仍然不理解算法的細(xì)節(jié)部分。
2
Transformer代碼不易看懂,因?yàn)樽饔脵C(jī)制與CNN有不少差別,所以完全理解代碼并實(shí)踐應(yīng)用需要花費(fèi)很大功夫。
3
那么如何學(xué)習(xí)基于Tansformer的目標(biāo)檢測(cè)算法呢?
實(shí)踐部分


審核編輯:劉清
-
計(jì)算機(jī)視覺
+關(guān)注
關(guān)注
9文章
1715瀏覽量
47542 -
自動(dòng)駕駛
+關(guān)注
關(guān)注
792文章
14799瀏覽量
178279 -
Transformer
+關(guān)注
關(guān)注
0文章
154瀏覽量
6871
原文標(biāo)題:Transformer在自動(dòng)駕駛中的應(yīng)用前景怎么樣?
文章出處:【微信號(hào):3D視覺工坊,微信公眾號(hào):3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
瑞芯微(EASY EAI)RV1126B 安全帽檢測(cè)
Melexis推出針對(duì)FIR陣列的免費(fèi)版人員檢測(cè)算法
有哪些常見的AI算法可以用于裝置數(shù)據(jù)的異常檢測(cè)?
基于FPGA的SSD目標(biāo)檢測(cè)算法設(shè)計(jì)
【嘉楠堪智K230開發(fā)板試用體驗(yàn)】K230機(jī)器視覺相關(guān)功能體驗(yàn)
基于RK3576開發(fā)板的車輛檢測(cè)算法
基于RK3576開發(fā)板的安全帽檢測(cè)算法
基于RV1126開發(fā)板的車輛檢測(cè)算法開發(fā)
基于RV1126開發(fā)板的吸煙檢測(cè)算法開發(fā)
基于RV1126開發(fā)板的安全帽檢測(cè)算法開發(fā)
基于RV1126開發(fā)板的火焰檢測(cè)算法開發(fā)
如何學(xué)習(xí)基于Tansformer的目標(biāo)檢測(cè)算法呢?
評(píng)論