亚洲人成无码网www影,精品人妻无码H动漫

隨著自主機器的發(fā)展，我們可以在生活中經(jīng)?？吹阶灾鳈C器的應(yīng)用。有傳統(tǒng)應(yīng)用的倉庫工廠 AMR、機械臂、銀行酒店里面的服務(wù)機器人、家庭機器人、無人物流車、自主礦卡等等。不同的自主機器，軟件架構(gòu)的方案也不一樣，但核心的模塊定位、導(dǎo)航、感知、控制等都是相通的。

定位模塊是自主機器最核心的模塊之一，定位又包括全局定位和局部定位，對于自主機器，其精度需要達到厘米級別。

本文我們將討論全局定位，即確定自主機器在全局下的位置。傳統(tǒng)的低速自主機器，類似于 AMR 等，其采用的定位方式通常以 SLAM（Simultaneous Localization and Mapping）的方法進行同時建圖和定位，但是該方法實現(xiàn)代價高、難度大，并不適用于室外自主機器——類似于無人物流車、園區(qū)接駁車等的實時高精度定位需求。這些室外自主機器行駛速度快、距離遠、環(huán)境復(fù)雜，使得 SLAM 的精度下降，同時遠距離的行駛將導(dǎo)致實時構(gòu)建的地圖偏移過大。因此，如果在已有高精度的全局地圖的情況下進行自主機器的定位，將極大的簡化該問題。

因此，將問題分為獨立的兩部分：建圖 Mapping 和定位 Matching。NDT 是一種點云配準(zhǔn)算法，可同時用于點云的建圖和定位。

CUDA-NDT

正態(tài)分布變換算法（NormalDistributions Transform, NDT）同 ICP 算法的功能一致，即，用于計算兩幀點云數(shù)據(jù)之間的坐標(biāo)變換矩陣，從而能夠使不同的坐標(biāo)下的點云數(shù)據(jù)合并到同一個坐標(biāo)系統(tǒng)中。不同的是 NDT 算法對初值不敏感，且不需要進行對應(yīng)點的特征計算，所以速度較快。NDT 算法使用應(yīng)用于 3D 點統(tǒng)計模型的標(biāo)準(zhǔn)優(yōu)化技術(shù)來確定兩個點云之間最可能的配準(zhǔn)。

NDT 算法和 ICP 算法可以結(jié)合使用，以提高配準(zhǔn)精度和速度。首先，NDT 算法可用于粗配準(zhǔn)，得到轉(zhuǎn)換參數(shù)；然后使用 ICP 算法結(jié)合參數(shù)進行精細(xì)配準(zhǔn)。為了改進 NDT 算法在 NVIDIA Jetson 上的性能，我們推薦使用基于 CUDA 加速的 CUDA-NDT。

使用CUDA-NDT

以下是 CUDA-NDT 的使用實例。我們需要初始化相關(guān)的類對象，設(shè)置相關(guān)的參數(shù)，并調(diào)用接口函數(shù)。

cudaNDT ndtTest(nPCountM, nQCountM, stream);ndtTest.setInputSource(source);ndtTest.setInputTarget(target);ndtTest.setResolution(resolution);ndtTest.setMaximumIterations(nr_iterations);ndtTest.setTransformationEpsilon(epsilon);ndtTest.setStepSize(step_size);    ndtTest.ndt(cloud_source, nPCount,               cloud_target, nQCount, guess,transformation_matrix,stream);

CUDA-NDT 計算的輸出是 transformation_matrix，代表的含義如下：

源點云 (P)* transformation_matrix = 目標(biāo)坐標(biāo)系的點云 (Q)

因為激光類型的輸出點云的數(shù)量為固定值，所以 CUDA-NDT 在輸出化的時候，要求輸入兩幀點云的最大數(shù)量，從而分配計算資源。

class cudaNDT{public:    /*       nPCountM and nQCountM are the maximum of count for input clouds       They are used to pre-allocate memory.    */    cudaNDT(int nPCountM, int nQCountM, cudaStream_t stream = 0);    ~cudaNDT(void);void setInputSource (void *source);void setInpuTarget (void *target);void setResolution (float resolution);void setMaximumIterations (int nr_iterations);void setTransformationEpsilon (double epsilon);void setStepSize (double step_size);    /*    cloud_target = transformation_matrix * cloud_source    When the Epsilon of transformation_matrix is less than threshold,    the function will return transformation_matrix.    Input:        cloud_source, cloud_target: data pointer for points cloud        nPCount: the points number of cloud_source        nQCount: the points number of cloud_target        guess: initial guess of transformation_matrix        stream: CUDA stream    Output:        transformation_matrix: rigid transformation matrix    */
    void ndt(float *cloud_source, int nPCount,            float *cloud_target, int nQCount,            float *guess, void *transformation_matrix,            cudaStream_t stream = 0);    void *m_handle = NULL;};

經(jīng)過 CUDA 加速的 NDT 速度對比微加速版本提升了 4 倍左右，請參考下表的性能對比，經(jīng)過 NDT 匹配的點云效果對比請參考圖 1 和圖 2。

	CUDA-NDT	PCL-NDT
count of pointscloud	7000	7000
cost time(ms)	34.7789	136.858
fitness_score	0.538	0.540

CUDA-NDT 與 PCL-NDT 的性能對比

開始使用CUDA-NDT

我們希望通過本文介紹使用 CUDA-NDT 從而獲得更好的點云注冊性能。

因為 NDT 在 NVIDIA Jetson 上無法使用 CUDA 進行點云的加速處理，所以我們開發(fā)了基于 CUDA 的 CUDA-NDT。

復(fù)制鏈接，獲得相關(guān)庫和實例代碼。

https://github.com/NVIDIA-AI-IOT/cuda-pcl/tree/main/cuda-ndt

審核編輯：湯梓紅

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴