chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

物體抓取領域的機器視覺

新機器視覺 ? 來源:知乎 ? 作者:知乎 ? 2021-06-18 11:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

機器視覺的角度,由簡入繁從相機標定,平面物體檢測、有紋理物體、無紋理物體、深度學習、與任務/運動規(guī)劃結合等6個方面深度解析文章的標題。

首先,我們要了解,機器人領域的視覺(Machine Vision)跟計算機領域(Computer Vision)的視覺有一些不同:機器視覺的目的是給機器人提供操作物體的信息。所以,機器視覺的研究大概有這幾塊:

1. 物體識別(Object Recognition):在圖像中檢測到物體類型等,這跟 CV 的研究有很大一部分交叉;

2. 位姿估計(Pose Estimation):計算出物體在攝像機坐標系下的位置和姿態(tài),對于機器人而言,需要抓取東西,不僅要知道這是什么,也需要知道它具體在哪里;

3. 相機標定(Camera Calibration):因為上面做的只是計算了物體在相機坐標系下的坐標,我們還需要確定相機跟機器人的相對位置和姿態(tài),這樣才可以將物體位姿轉換到機器人位姿。

當然,我這里主要是在物體抓取領域的機器視覺;SLAM 等其他領域的就先不講了。

由于視覺是機器人感知的一塊很重要內容,所以研究也非常多了,我就我了解的一些,按照由簡入繁的順序介紹吧。

一。 相機標定

這其實屬于比較成熟的領域。由于我們所有物體識別都只是計算物體在相機坐標系下的位姿,但是,機器人操作物體需要知道物體在機器人坐標系下的位姿。所以,我們先需要對相機的位姿進行標定。

內參標定就不說了,參照張正友的論文,或者各種標定工具箱;

外參標定的話,根據相機安裝位置,有兩種方式:

Eye to Hand:相機與機器人極坐標系固連,不隨機械臂運動而運動

Eye in Hand:相機固連在機械臂上,隨機械臂運動而運動

兩種方式的求解思路都類似,首先是眼在手外(Eye to Hand)

279ce6d4-cf69-11eb-9e57-12bb97331649.jpg

只需在機械臂末端固定一個棋盤格,在相機視野內運動幾個姿態(tài)。由于相機可以計算出棋盤格相對于相機坐標系的位姿A_i 、機器人運動學正解可以計算出機器人底座到末端抓手之間的位姿變化E_i 、而末端爪手與棋盤格的位姿相對固定不變。

這樣,我們就可以得到一個坐標系環(huán) CX=XD

這種結構的求解有很多方法,我這邊給出一個參考文獻:

Shiu, Yiu Cheung, and Shaheen Ahmad. “Calibration of wrist-mounted robotic sensors by solving homogeneous transform equations of the form AX= XB.”ieee Transactions on Robotics and Automation 5.1 (1989): 16-29.

而對于眼在手上(Eye in Hand)的情況,也類似,在地上隨便放一個棋盤格(與機器人基座固連),然后讓機械臂帶著相機走幾個位姿,然后也可以形成一個AX=XB 的坐標環(huán)。

27bcf64a-cf69-11eb-9e57-12bb97331649.jpg

二. 平面物體檢測

這是目前工業(yè)流水線上最常見的場景。目前來看,這一領域對視覺的要求是:快速、精確、穩(wěn)定。所以,一般是采用最簡單的邊緣提取+邊緣匹配/形狀匹配的方法;而且,為了提高穩(wěn)定性、一般會通過主要打光源、采用反差大的背景等手段,減少系統(tǒng)變量。

目前,很多智能相機(如 cognex)都直接內嵌了這些功能;而且,物體一般都是放置在一個平面上,相機只需計算物體的(x,y,θ)T 三自由度位姿即可。

另外,這種應用場景一般都是用于處理一種特定工件,相當于只有位姿估計,而沒有物體識別。

當然,工業(yè)上追求穩(wěn)定性無可厚非,但是隨著生產自動化的要求越來越高,以及服務類機器人的興起。對更復雜物體的完整位姿(x,y,z,rx,ry,rz)T 估計也就成了機器視覺的研究熱點。

三.有紋理的物體

機器人視覺領域是最早開始研究有紋理的物體的,如飲料瓶、零食盒等表面帶有豐富紋理的都屬于這一類。

當然,這些物體也還是可以用類似邊緣提取+模板匹配的方法。但是,實際機器人操作過程中,環(huán)境會更加復雜:光照條件不確定(光照)、物體距離相機距離不確定(尺度)、相機看物體的角度不確定(旋轉、仿射)、甚至是被其他物體遮擋(遮擋)。

幸好有一位叫做 Lowe 的大神,提出了一個叫做 SIFT (Scale-invariant feature transform)的超強局部特征點:

Lowe, David G. “Distinctive image features from scale-invariant keypoints.”International journal of computer vision 60.2 (2004): 91-110.

具體原理可以看上面這篇被引用 4萬+ 的論文或各種博客,簡單地說,這個方法提取的特征點只跟物體表面的某部分紋理有關,與光照變化、尺度變化、仿射變換、整個物體無關。

因此,利用 SIFT 特征點,可以直接在相機圖像中尋找到與數據庫中相同的特征點,這樣,就可以確定相機中的物體是什么東西(物體識別)。

對于不會變形的物體,特征點在物體坐標系下的位置是固定的。所以,我們在獲取若干點對之后,就可以直接求解出相機中物體與數據庫中物體之間的單應性矩陣。

如果我們用深度相機(如Kinect)或者雙目視覺方法,確定出每個特征點的 3D 位置。那么,直接求解這個 PnP 問題,就可以計算出物體在當前相機坐標系下的位姿。

↑ 這里就放一個實驗室之前畢業(yè)師兄的成果

當然,實際操作過程中還是有很多細節(jié)工作才可以讓它真正可用的,如:先利用點云分割和歐氏距離去除背景的影響、選用特征比較穩(wěn)定的物體(有時候 SIFT 也會變化)、利用貝葉斯方法加速匹配等。

而且,除了 SIFT 之外,后來又出了一大堆類似的特征點,如 SURF、ORB 等。

四. 無紋理的物體

好了,有問題的物體容易解決,那么生活中或者工業(yè)里還有很多物體是沒有紋理的:

我們最容易想到的就是:是否有一種特征點,可以描述物體形狀,同時具有跟 SIFT 相似的不變性?

不幸的是,據我了解,目前沒有這種特征點。

所以,之前一大類方法還是采用基于模板匹配的辦法,但是,對匹配的特征進行了專門選擇(不只是邊緣等簡單特征)。

這里,我介紹一個我們實驗室之前使用和重現過的算法 LineMod:

Hinterstoisser, Stefan, et al. “Multimodal templates for real-time detection of texture-less objects in heavily cluttered scenes.” Computer Vision (ICCV), 2011 IEEE International Conference on. IEEE, 2011.

簡單而言,這篇論文同時利用了彩色圖像的圖像梯度和深度圖像的表面法向作為特征,與數據庫中的模板進行匹配。

由于數據庫中的模板是從一個物體的多個視角拍攝后生成的,所以這樣匹配得到的物體位姿只能算是初步估計,并不精確。

但是,只要有了這個初步估計的物體位姿,我們就可以直接采用 ICP 算法(Iterative closest point)匹配物體模型與 3D 點云,從而得到物體在相機坐標系下的精確位姿。

當然,這個算法在具體實施過程中還是有很多細節(jié)的:如何建立模板、顏色梯度的表示等。另外,這種方法無法應對物體被遮擋的情況。(當然,通過降低匹配閾值,可以應對部分遮擋,但是會造成誤識別)。

針對部分遮擋的情況,我們實驗室的張博士去年對 LineMod 進行了改進,但由于論文尚未發(fā)表,所以就先不過多涉及了。

五.深度學習

由于深度學習在計算機視覺領域得到了非常好的效果,我們做機器人的自然也會嘗試把 DL 用到機器人的物體識別中。

首先,對于物體識別,這個就可以照搬 DL 的研究成果了,各種 CNN 拿過來用就好了。在 2016 年的『亞馬遜抓取大賽』中,很多隊伍都采用了 DL 作為物體識別算法。

然而, 在這個比賽中,雖然很多人采用 DL 進行物體識別,但在物體位姿估計方面都還是使用比較簡單、或者傳統(tǒng)的算法。似乎并未廣泛采用 DL。如 周博磊 所說,一般是采用 semantic segmentation network 在彩色圖像上進行物體分割,之后,將分割出的部分點云與物體 3D 模型進行 ICP 匹配。

當然,直接用神經網絡做位姿估計的工作也是有的,如這篇:

Doumanoglou, Andreas, et al. “Recovering 6d object pose and predicting next-best-view in the crowd.” Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2016.

它的方法大概是這樣:對于一個物體,取很多小塊 RGB-D 數據(只關心一個patch,用局部特征可以應對遮擋);每小塊有一個坐標(相對于物體坐標系);然后,首先用一個自編碼器對數據進行降維;之后,用將降維后的特征用于訓練Hough Forest。

六。 與任務/運動規(guī)劃結合

這部分也是比較有意思的研究內容,由于機器視覺的目的是給機器人操作物體提供信息,所以,并不限于相機中的物體識別與定位,往往需要跟機器人的其他模塊相結合。

我們讓機器人從冰箱中拿一瓶『雪碧』,但是這個 『雪碧』 被『美年達』擋住了。

我們人類的做法是這樣的:先把 『美年達』 移開,再去取 『雪碧』 。

所以,對于機器人來說,它需要先通過視覺確定雪碧在『美年達』后面,同時,還需要確定『美年達』這個東西是可以移開的,而不是冰箱門之類固定不可拿開的物體。 當然,將視覺跟機器人結合后,會引出其他很多好玩的新東西。

責任編輯:lq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    213

    文章

    30627

    瀏覽量

    219708
  • 機器視覺
    +關注

    關注

    163

    文章

    4735

    瀏覽量

    125068
  • 定位技術
    +關注

    關注

    7

    文章

    310

    瀏覽量

    26326
  • 工業(yè)機器人

    關注

    91

    文章

    3509

    瀏覽量

    97371

原文標題:工業(yè)機器人抓取定位技術

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    紅外熱成像儀為什么是機器視覺領域的核心競爭點?

    紅外熱成像技術在軍事與民用領域廣泛應用,結合機器視覺發(fā)展,推動工業(yè)檢測和無損檢測進步,國內技術已實現突破并市場化。
    的頭像 發(fā)表于 11-21 09:35 ?67次閱讀

    力傳感器在工業(yè)自動化機器人中的應用:精確抓取/裝配作業(yè)/搬運作業(yè)/柔順控制

    具體應用 精確抓取: 在自動化生產線上,機器人需要精確抓取各種物品。力傳感器可以安裝在機器人的末端執(zhí)行器上,實時感知抓取
    的頭像 發(fā)表于 11-14 09:10 ?57次閱讀
    力傳感器在工業(yè)自動化<b class='flag-5'>機器</b>人中的應用:精確<b class='flag-5'>抓取</b>/裝配作業(yè)/搬運作業(yè)/柔順控制

    機器視覺系統(tǒng)中工業(yè)相機的常用術語解讀

    1、機器視覺系統(tǒng)機器視覺系統(tǒng)machinevisionsystem是通過對聲波、電磁輻射等時空模式進行探測及感知,對所獲取的圖像進行自動處理、分析和測量,做出定性解釋和定量分析,得到有
    的頭像 發(fā)表于 10-31 17:34 ?1004次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>視覺</b>系統(tǒng)中工業(yè)相機的常用術語解讀

    RK3576機器人核心:三屏異顯+八路攝像頭,重塑機器人交互與感知

    瑞芯微RK3576 AIoT處理器處理器憑借其卓越的多屏異顯與8路攝像頭接入能力,為機器領域帶來革新。米爾電子MYD-LR3576開發(fā)板實測數據顯示,在高負載下CPU占用僅34%,完美實現多路視覺
    發(fā)表于 10-29 16:41

    格物優(yōu)信紅外熱成像技術在機器視覺領域的應用

    格物優(yōu)信紅外熱成像技術在機器視覺領域的應用正日益展現出其獨特價值。隨著紅外成像技術的持續(xù)突破,該技術已深入電力、工業(yè)檢測、安防及農業(yè)等多個領域,特別是在與
    的頭像 發(fā)表于 10-22 10:43 ?515次閱讀

    機器視覺系統(tǒng)工業(yè)相機的成像原理及如何選型

    機器視覺系統(tǒng)是一種模擬人類視覺功能,通過光學裝置和非接觸式傳感器獲取圖像數據,并進行分析和處理,以實現對目標物體的識別、測量、檢測和定位等功能的智能化系統(tǒng)。其目的是讓
    的頭像 發(fā)表于 08-07 14:14 ?1040次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>視覺</b>系統(tǒng)工業(yè)相機的成像原理及如何選型

    廣和通純視覺技術在智能割草機器領域的應用

    在2025歐洲工具及智能硬件領域“黃金標準”Heimwerker的最新測評中,搭載廣和通純視覺方案的智能割草機器人,憑借高達標性能、強環(huán)境適應性、卓越用戶體驗,贏得了該國際權威評測機構的五星好評
    的頭像 發(fā)表于 07-11 11:21 ?934次閱讀

    一文帶你了解什么是機器視覺網卡

    千兆以太網或萬兆以太網相機產生的大量圖像數據流。萬兆網卡能提供更高的帶寬,滿足高分辨率、高幀率相機的需求。支持GigEVision協議:這是機器視覺領域最重要的工業(yè)
    的頭像 發(fā)表于 07-09 16:18 ?422次閱讀
    一文帶你了解什么是<b class='flag-5'>機器</b><b class='flag-5'>視覺</b>網卡

    EtherCAT科普系列(8):EtherCAT技術在機器視覺領域的應用

    機器視覺是基于軟件與硬件的組合,通過光學裝置和非接觸式的傳感器自動地接受一個真實物體的圖像,并利用軟件算法處理圖像以獲得所需信息或用于控制機器人運動的裝置。
    的頭像 發(fā)表于 05-15 17:09 ?1289次閱讀
    EtherCAT科普系列(8):EtherCAT技術在<b class='flag-5'>機器</b><b class='flag-5'>視覺</b><b class='flag-5'>領域</b>的應用

    【「# ROS 2智能機器人開發(fā)實踐」閱讀體驗】視覺實現的基礎算法的應用

    : 一、機器視覺:從理論到實踐 第7章詳細介紹了ROS2在機器視覺領域的應用,涵蓋了相機標定、OpenCV集成、
    發(fā)表于 05-03 19:41

    富唯智能最小復合機器人的強大抓取實力?

    在工業(yè)自動化領域,復合機器人的身影愈發(fā)常見。但你是否好奇,最小的復合機器人能抓取多少多重?富唯智能以創(chuàng)新技術,給出了令人驚嘆的答案,徹底顛覆我們對小身形
    的頭像 發(fā)表于 04-16 16:31 ?543次閱讀
    富唯智能最小復合<b class='flag-5'>機器</b>人的強大<b class='flag-5'>抓取</b>實力?

    復合機器抓取精度的影響因素及提升策略

    復合機器人結合了移動機器人(如AGV)和機械臂的功能,廣泛應用于物流、制造等領域抓取精度是其核心性能指標之一,直接影響作業(yè)效率和產品質量。本文將探討復合
    的頭像 發(fā)表于 04-12 11:15 ?734次閱讀

    破解透明物體抓取難題,地瓜機器人 CASIA 推出幾何和語義融合的單目抓取方案|ICRA 2025

    近日,全球機器領域頂會ICRA 2025(IEEE機器人與自動化國際會議)公布論文錄用結果,地瓜機器人主導研發(fā)的DOSOD開放詞匯目標檢測算法與MODEST單目透明
    的頭像 發(fā)表于 03-05 19:30 ?1261次閱讀
    破解透明<b class='flag-5'>物體</b><b class='flag-5'>抓取</b>難題,地瓜<b class='flag-5'>機器</b>人 CASIA 推出幾何和語義融合的單目<b class='flag-5'>抓取</b>方案|ICRA 2025

    DLP160CP DMD是否可以應用于機器視覺應用?

    關于DLP160CPDMD芯片有一個疑問, 請問該芯片是否可以應用在機器3D視覺(結構光)場景應用呢?我在TI TLP機器視覺,“3D掃描視覺
    發(fā)表于 02-20 07:39

    紅外熱成像技術在個人視覺領域的創(chuàng)新應用

    紅外熱成像技術,一項原本應用于航空、醫(yī)療等高端領域的技術,正逐步進入個人消費市場,帶來了全新的視覺體驗。由于其能夠感知物體發(fā)出的紅外輻射并將其轉化為圖像的特點,紅外熱成像突破了傳統(tǒng)視覺
    的頭像 發(fā)表于 02-19 15:25 ?967次閱讀
    紅外熱成像技術在個人<b class='flag-5'>視覺</b><b class='flag-5'>領域</b>的創(chuàng)新應用