自動駕駛難度很大,標記數(shù)據(jù)不應該那么難。
像素級語義掩碼在2D和3D投影之間完美關(guān)聯(lián)據(jù)麥姆斯咨詢報道,激光雷達(LiDAR)新銳廠商Ouster近日與Playment和Scale.AI一起宣布了一項激光雷達數(shù)據(jù)標記合作伙伴計劃,以為Ouster快速增長的客戶群(目前已超過300家,并且還在不斷增長中?。┖喕⑻岣呒す饫走_數(shù)據(jù)標記的效率。Ouster希望其開發(fā)的數(shù)據(jù)標記技術(shù)不僅可以服務于Ouster的客戶,還能惠及廣闊的機器學習行業(yè)。幾個月來,Ouster與Playment和Scale.AI合作開發(fā)了一種新的數(shù)據(jù)標記工具,利用Ouster激光雷達數(shù)據(jù)自身的2D-3D特性,將數(shù)據(jù)標記成本降低了50%,并能提供更高精度、更快速的標記以及更多的標記選項,還能大大簡化從數(shù)據(jù)捕獲到開始模型訓練的過程。此外,Ouster還為激光雷達數(shù)據(jù)開發(fā)了一種開放格式,使客戶的數(shù)據(jù)記錄、存儲、傳輸、加載和標記變得更加簡單。Ouster開放了這種數(shù)據(jù)格式,希望產(chǎn)業(yè)其它廠商能夠圍繞Ouster已經(jīng)開始的工作進行標準化(盡管它只支持結(jié)構(gòu)化激光雷達數(shù)據(jù))。這種激光雷達格式將包含在Ouster開源驅(qū)動的更新中,使客戶的OS-1傳感器數(shù)據(jù)能夠直接以這種格式記錄,以便將其轉(zhuǎn)移到Playment、Scale.AI或其他廠商進行數(shù)據(jù)標記。結(jié)構(gòu)化激光雷達數(shù)據(jù)的優(yōu)勢
OS-1傳感器結(jié)構(gòu)化激光雷達數(shù)據(jù)的可視化
傳統(tǒng)激光雷達通常采用機械旋轉(zhuǎn)單元或者是光束掃描單元。典型的機械旋轉(zhuǎn)激光雷達傾向于以非恒定的速度旋轉(zhuǎn),導致每幀的點間隔不均勻。同時,MEMS或掃描激光雷達傾向于有部分光束以非線性S形曲線掃描。這些都不利于將激光雷達數(shù)據(jù)存儲在固定網(wǎng)格中,用于2D深度學習、壓縮數(shù)據(jù)格式和易于標記。得益于Ouster的多光束flash激光雷達設(shè)計,Ouster的OS-1傳感器能夠輸出結(jié)構(gòu)化激光雷達數(shù)據(jù),其中水平和垂直角度間距就像相機一樣,始終保持不變。這就能使激光雷達輸出2048 x 64像素尺寸固定的深度圖以及每幀上的強度和環(huán)境光圖像,從而可以使用卷積神經(jīng)網(wǎng)絡,并大規(guī)模簡化圖像存儲和標記。
雖然RGB-D相機和傳統(tǒng)flash激光雷達也能夠輸出結(jié)構(gòu)化深度數(shù)據(jù),但與Ouster OS-1相比,這兩類傳感器在室外環(huán)境中的探測距離、深度分辨率、視場或穩(wěn)定性都不如OS-1。不過,這些短距離結(jié)構(gòu)化3D相機仍然可以從Ouster正在開發(fā)的工作中受益,Ouster鼓勵這些產(chǎn)品的制造商考慮應用Ouster的方案。結(jié)構(gòu)化激光雷達數(shù)據(jù)的標記工作流Ouster通過與標記合作伙伴合作,在其標記工具中利用Ouster的結(jié)構(gòu)化數(shù)據(jù)優(yōu)勢,最大限度地降低了標記成本,提高其功能性,并顯著提高了注釋精度。例如:
- 為注釋器提供同步的2D和3D視圖,作為當前任務的直觀視覺確認;
- 在2D激光雷達圖像中注釋像素級掩碼,并使用3D點云檢查掩碼精度,通過添加或移除單個點或選擇點簇并更新2D掩碼,來優(yōu)化3D點云內(nèi)的掩碼;
- 使用3D邊界框自動生成100%準確的2D掩碼(語義或?qū)嵗指睿?、長方體或2D圖像中的邊界框。一旦親身了解過這種標記流程的運行,就會清楚它有多高效和準確。另一種方法是為2D和3D數(shù)據(jù)復制這項工作:
從3D邊界框自動生成的完美2D像素級掩碼(左下圖像),以及2D掩碼用于優(yōu)化3D邊界框的精度
這種方案盡可能用最少的工作量和最高的精度,提供了最大的標記族,從2D邊界框、語義和實例掩碼到3D邊界框(2D或3D)、點云語義和實例分割。
頂部圖像中顯示了手工標記的3D邊界框,下圖2D幀圖像中顯示了自動生成的像素級掩碼、邊界框和長方體這些意味著什么?10~50%的成本降低和更快地標記無需單獨標記2D和3D數(shù)據(jù)集,Ouster將所需的注釋量減少了2倍,最終降低了客戶的成本。更小的文件尺寸Ouster的開源結(jié)構(gòu)化數(shù)據(jù)格式,可將文件尺寸及其相關(guān)的傳輸成本降低97%。目前,隨著激光雷達數(shù)據(jù)量的不斷增高,以至于一些客戶需要將硬盤驅(qū)動器運送給他們的標記合作伙伴。是時候改變這一現(xiàn)狀了!更高的標記精度通過2D和3D格式之間標記的可轉(zhuǎn)換性,提高了2D和3D標記精度,為注釋提供了更多的視覺輔助,實現(xiàn)了100%準確的2D語義掩碼。語義分割中不再有邊界問題。即使是商店和展廳內(nèi)的行人和汽車也能輕松準確地進行標記!更準確的標記還意味著Ouster可以在測試算法時生成更準確、可測量和有意義的指標。
注意圖中汽車經(jīng)銷商展廳的窗框,已經(jīng)自動從車輛掩碼中去除
盡管圖中零售店的人群中分布著樹木、窗戶和家具,但這些顧客在2D圖像中也被完美地分割出來
動態(tài)遮罩(Rotoscoping)和綠屏摳像這些詞匯是不是看起來有點眼熟,因為它們確實很流行。在另一個大眾產(chǎn)業(yè),幾十年來一直在投資在大型2D圖像集中生成像素精確掩碼的技術(shù)和工具,那就是:電影產(chǎn)業(yè)。動態(tài)遮罩和綠屏摳像技術(shù)已經(jīng)有很長的歷史,通常是高度手動的(對綠屏摳像來說略少),是一種從相機的場景中分割演員和其它感興趣的對象以進行合成的方法。像自動駕駛和機器人產(chǎn)業(yè)一樣,它們最近一直在開發(fā)利用3D相機和深度學習的自動化動態(tài)遮罩技術(shù)。
-
傳感器
+關(guān)注
關(guān)注
2574文章
54438瀏覽量
786367 -
激光雷達
+關(guān)注
關(guān)注
978文章
4384瀏覽量
195440
原文標題:激光雷達也需軟硬兼顧:結(jié)構(gòu)化激光雷達數(shù)據(jù)及其標記
文章出處:【微信號:MEMSensor,微信公眾號:MEMS】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄

探析傳感器結(jié)構(gòu)化激光雷達數(shù)據(jù)及其標記
評論