chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用KeyPointRCNN輕松獲取人體的17個關(guān)鍵點(diǎn)

OpenCV學(xué)堂 ? 來源:OpenCV學(xué)堂 ? 作者:gloomyfish ? 2022-10-14 17:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

前言

TorchVision支持主流姿態(tài)評估模型關(guān)鍵點(diǎn)檢測模型KeyPointRCNN,通過它可以輕松獲取人體的17個關(guān)鍵點(diǎn),跟OpenPose等模型相比,KeyPointRCNN基于TorchVision框架,遷移學(xué)習(xí)訓(xùn)練簡單,支持一鍵導(dǎo)出ONNX格式,可以部署到ONNXRUNTIME與OpenVINO,支持C++PythonSDK部署,可以說在易用性上絲毫不差!

14a3e83c-4b9d-11ed-a3b6-dac502259ad0.jpg

KeyPointRCNN模型介紹

Torchvision中KeyPointRCNN已經(jīng)是基于2021年的論文中的最新版本,效果非常好,2021年論文比2019論文最大的改動在預(yù)測的編碼與解碼部分,提出了CIF與CAF兩種新的編碼方法,模型結(jié)構(gòu)圖示如下:

14ebe696-4b9d-11ed-a3b6-dac502259ad0.png

上述一段英文交代的比較清楚,模型輸入就是一張RGB彩色圖像,模型最終的輸出有四個部分組成,分別是boxes、labels、scores、keypoints,它們的輸出結(jié)構(gòu)如下:

15bba5ca-4b9d-11ed-a3b6-dac502259ad0.png

不是還有最后一個輸出層沒有解釋嗎,最后一個輸出層其實是各個關(guān)鍵點(diǎn)的得分信息,小于的基本上應(yīng)該都被干掉,不可信。

另外KeyPoint部分輸出是17x3,3表示x、y、v其中v表示是否可見,v為1表示該關(guān)鍵點(diǎn)可見、v為0表示該關(guān)鍵點(diǎn)不可見。 各個關(guān)節(jié)點(diǎn)的連接順序與編碼坐標(biāo)如下(寫代碼有用的):

27b1581a-4b9d-11ed-a3b6-dac502259ad0.png

27dd11da-4b9d-11ed-a3b6-dac502259ad0.png

KeyPointRCNN推理演示

Torchvision官方提供了預(yù)訓(xùn)練的模型,直接下載之后,通過下面的腳本就可以轉(zhuǎn)換為ONNX格式模型,然后通過ONNXRUNTIME就可以完成推理演示。

第一步,轉(zhuǎn)ONNX格式

相關(guān)腳本如下

model=torchvision.models.detection.keypointrcnn_resnet50_fpn(weights=KeypointRCNN_ResNet50_FPN_Weights.DEFAULT)
model.eval()
x=[torch.rand(3,300,400),torch.rand(3,500,400)]
predictions=model(x)

#optionally,ifyouwanttoexportthemodeltoONNX:
torch.onnx.export(model,x,"keypoint_rcnn.onnx",opset_version=11)
如果不工作,請參考這里的轉(zhuǎn)換腳本修改之: TorchVision對象檢測RetinaNet推理演示

第二步:ONNRUNTIME推理演示

這部分跟之前發(fā)過一篇RetinaNet推理文章非常相似,這篇文章的連接如下,代碼只是稍微改了那么一點(diǎn)點(diǎn),增加了KeyPoint部分的可視化,推理部分的代碼如下:
importonnxruntimeasort
importcv2ascv
importnumpyasnp
importtorchvision

coco_names={'0':'background','1':'person','2':'bicycle','3':'car','4':'motorcycle','5':'airplane','6':'bus',
'7':'train','8':'truck','9':'boat','10':'trafficlight','11':'firehydrant','13':'stopsign',
'14':'parkingmeter','15':'bench','16':'bird','17':'cat','18':'dog','19':'horse','20':'sheep',
'21':'cow','22':'elephant','23':'bear','24':'zebra','25':'giraffe','27':'backpack',
'28':'umbrella','31':'handbag','32':'tie','33':'suitcase','34':'frisbee','35':'skis',
'36':'snowboard','37':'sportsball','38':'kite','39':'baseballbat','40':'baseballglove',
'41':'skateboard','42':'surfboard','43':'tennisracket','44':'bottle','46':'wineglass',
'47':'cup','48':'fork','49':'knife','50':'spoon','51':'bowl','52':'banana','53':'apple',
'54':'sandwich','55':'orange','56':'broccoli','57':'carrot','58':'hotdog','59':'pizza',
'60':'donut','61':'cake','62':'chair','63':'couch','64':'pottedplant','65':'bed',
'67':'diningtable','70':'toilet','72':'tv','73':'laptop','74':'mouse','75':'remote',
'76':'keyboard','77':'cellphone','78':'microwave','79':'oven','80':'toaster','81':'sink',
'82':'refrigerator','84':'book','85':'clock','86':'vase','87':'scissors','88':'teddybear',
'89':'hairdrier','90':'toothbrush'}

transform=torchvision.transforms.Compose([torchvision.transforms.ToTensor()])

sess_options=ort.SessionOptions()
#Belowisforoptimizingperformance
sess_options.intra_op_num_threads=24
#sess_options.execution_mode=ort.ExecutionMode.ORT_PARALLEL
sess_options.graph_optimization_level=ort.GraphOptimizationLevel.ORT_ENABLE_ALL
ort_session=ort.InferenceSession("keypointrcnn_resnet50_fpn.onnx",sess_options=sess_options,
providers=['CUDAExecutionProvider'])
src=cv.imread("D:/images/messi_player.jpg")
cv.namedWindow("KeyPointRCNNDetectionDemo",cv.WINDOW_AUTOSIZE)
image=cv.cvtColor(src,cv.COLOR_BGR2RGB)
blob=transform(image)
c,h,w=blob.shape
input_x=blob.view(1,c,h,w)
defto_numpy(tensor):
returntensor.detach().cpu().numpy()iftensor.requires_gradelsetensor.cpu().numpy()

#computeONNXRuntimeoutputprediction
ort_inputs={ort_session.get_inputs()[0].name:to_numpy(input_x)}
ort_outs=ort_session.run(None,ort_inputs)
#(N,4)dimensionalarraycontainingtheabsolutebounding-box
boxes=ort_outs[0]
#labels
labels=ort_outs[1]
#scores
scores=ort_outs[2]
#key_points
multi_key_points=ort_outs[3]

print(boxes.shape,boxes.dtype,labels.shape,labels.dtype,scores.shape,scores.dtype,multi_key_points.shape)

index=0
forx1,y1,x2,y2inboxes:
ifscores[index]>0.5:
cv.rectangle(src,(np.int32(x1),np.int32(y1)),
(np.int32(x2),np.int32(y2)),(140,199,0),2,8,0)
label_id=labels[index]
label_txt=coco_names[str(label_id)]
cv.putText(src,label_txt,(np.int32(x1),np.int32(y1)),cv.FONT_HERSHEY_SIMPLEX,0.75,(0,0,255),1)
kpts=np.int32(multi_key_points[index])

#nose->left_eye->left_ear.(0,1),(1,3)
cv.line(src,(kpts[0][0],kpts[0][1]),(kpts[1][0],kpts[1][1]),(255,255,0),2,8,0)
cv.line(src,(kpts[1][0],kpts[1][1]),(kpts[3][0],kpts[3][1]),(255,255,0),2,8,0)
#nose->right_eye->right_ear.(0,2),(2,4)
cv.line(src,(kpts[0][0],kpts[0][1]),(kpts[2][0],kpts[2][1]),(255,255,0),2,8,0)
cv.line(src,(kpts[2][0],kpts[2][1]),(kpts[4][0],kpts[4][1]),(255,255,0),2,8,0)
#nose->left_shoulder->left_elbow->left_wrist.(0,5),(5,7),(7,9)
cv.line(src,(kpts[0][0],kpts[0][1]),(kpts[5][0],kpts[5][1]),(255,255,0),2,8,0)
cv.line(src,(kpts[5][0],kpts[5][1]),(kpts[7][0],kpts[7][1]),(255,255,0),2,8,0)
cv.line(src,(kpts[7][0],kpts[7][1]),(kpts[9][0],kpts[9][1]),(255,255,0),2,8,0)
#nose->right_shoulder->right_elbow->right_wrist.(0,6),(6,8),(8,10)
cv.line(src,(kpts[0][0],kpts[0][1]),(kpts[6][0],kpts[6][1]),(255,255,0),2,8,0)
cv.line(src,(kpts[6][0],kpts[6][1]),(kpts[8][0],kpts[8][1]),(255,255,0),2,8,0)
cv.line(src,(kpts[8][0],kpts[8][1]),(kpts[10][0],kpts[10][1]),(255,255,0),2,8,0)
#left_shoulder->left_hip->left_knee->left_ankle.(5,11),(11,13),(13,15)
cv.line(src,(kpts[5][0],kpts[5][1]),(kpts[11][0],kpts[11][1]),(255,255,0),2,8,0)
cv.line(src,(kpts[11][0],kpts[11][1]),(kpts[13][0],kpts[13][1]),(255,255,0),2,8,0)
cv.line(src,(kpts[13][0],kpts[13][1]),(kpts[15][0],kpts[15][1]),(255,255,0),2,8,0)
#right_shoulder->right_hip->right_knee->right_ankle.(6,12),(12,14),(14,16)
cv.line(src,(kpts[6][0],kpts[6][1]),(kpts[12][0],kpts[12][1]),(255,255,0),2,8,0)
cv.line(src,(kpts[12][0],kpts[12][1]),(kpts[14][0],kpts[14][1]),(255,255,0),2,8,0)
cv.line(src,(kpts[14][0],kpts[14][1]),(kpts[16][0],kpts[16][1]),(255,255,0),2,8,0)
forx,y,_,inkpts:
cv.circle(src,(int(x),int(y)),3,(0,0,255),2,8,0)

index+=1
cv.imshow("KeyPointRCNNDetectionDemo",src)
cv.waitKey(0)
cv.destroyAllWindows()
測試與運(yùn)行結(jié)果如下:

39f23f08-4b9d-11ed-a3b6-dac502259ad0.jpg

3a16916e-4b9d-11ed-a3b6-dac502259ad0.jpg

基于3050的卡,GPU推理,速度!沒辦法模型有點(diǎn)大,速度有點(diǎn)慢,需要好N卡加持才能實時檢測!

3a53ac7a-4b9d-11ed-a3b6-dac502259ad0.png







審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 編解碼
    +關(guān)注

    關(guān)注

    1

    文章

    149

    瀏覽量

    20354
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4848

    瀏覽量

    88974
  • CAF
    CAF
    +關(guān)注

    關(guān)注

    1

    文章

    20

    瀏覽量

    14818

原文標(biāo)題:姿態(tài)評估之使用KeyPointRCNN關(guān)鍵點(diǎn)檢測模型輕松搞定!

文章出處:【微信號:CVSCHOOL,微信公眾號:OpenCV學(xué)堂】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    材料的晶體結(jié)構(gòu)看不清?EBSD助您獲取關(guān)鍵數(shù)據(jù)

    關(guān)鍵信息1.物相鑒定:EBSD能夠?qū)γ總€分析點(diǎn)進(jìn)行物相的識別和確認(rèn),這一過程基于晶體學(xué)的差異,并可結(jié)合化學(xué)信息(如能譜儀EDS提供的數(shù)據(jù))。2.晶體取向:EBSD
    的頭像 發(fā)表于 09-30 15:38 ?507次閱讀
    材料的晶體結(jié)構(gòu)看不清?EBSD助您<b class='flag-5'>獲取</b><b class='flag-5'>關(guān)鍵</b>數(shù)據(jù)

    瑞芯微RK3576人體關(guān)鍵點(diǎn)識別算法(骨骼點(diǎn)

    人體關(guān)鍵點(diǎn)識別是一種基于深度學(xué)習(xí)的對人進(jìn)行檢測定位與姿勢估計的模型,廣泛應(yīng)用于體育分析、動物行為監(jiān)測和機(jī)器人等領(lǐng)域,幫助機(jī)器實時解讀物理動作。本算法具有運(yùn)行效率高、實時性強(qiáng)的特點(diǎn)。
    的頭像 發(fā)表于 08-27 10:07 ?707次閱讀
    瑞芯微RK3576<b class='flag-5'>人體</b><b class='flag-5'>關(guān)鍵</b><b class='flag-5'>點(diǎn)</b>識別算法(骨骼<b class='flag-5'>點(diǎn)</b>)

    【開發(fā)實例】基于BPI-CanMV-K230D-Zero開發(fā)板實現(xiàn)人體關(guān)鍵點(diǎn)的實時動態(tài)識別

    項目介紹人體關(guān)鍵點(diǎn)檢測應(yīng)用使用YOLOv8n-pose模型對人體姿態(tài)進(jìn)行檢測;檢測結(jié)果得到17個人體骨骼
    的頭像 發(fā)表于 07-08 08:04 ?804次閱讀
    【開發(fā)實例】基于BPI-CanMV-K230D-Zero開發(fā)板實現(xiàn)<b class='flag-5'>人體</b><b class='flag-5'>關(guān)鍵</b><b class='flag-5'>點(diǎn)</b>的實時動態(tài)識別

    【BPI-CanMV-K230D-Zero開發(fā)板體驗】人體關(guān)鍵點(diǎn)檢測

    關(guān)鍵點(diǎn)檢測應(yīng)用使用 YOLOv8n-pose 模型對人體姿態(tài)進(jìn)行檢測; 檢測結(jié)果得到 17人體骨骼關(guān)鍵
    發(fā)表于 06-28 13:18

    學(xué)會這些方法,輕松搞定SMT貼片加工的坐標(biāo)獲取與校正

    一站式PCBA加工廠家今天為大家講講SMT貼片加工中如何獲取坐標(biāo)與校正?SMT貼片加工中的坐標(biāo)獲取與校正方法。在SMT貼片加工過程中,精準(zhǔn)的坐標(biāo)獲取與校正是確保組件精準(zhǔn)放置、提高產(chǎn)品質(zhì)量的關(guān)鍵
    的頭像 發(fā)表于 05-29 10:27 ?492次閱讀

    自動駕駛中常提的“點(diǎn)云”是啥?

    [首發(fā)于智駕最前沿微信公眾號]在自動駕駛系統(tǒng)中,點(diǎn)云技術(shù)作為三維空間感知的核心手段,為車輛提供了精確的距離和形狀信息,從而實現(xiàn)目標(biāo)檢測、環(huán)境建模、定位與地圖構(gòu)建等關(guān)鍵功能。那所謂的“點(diǎn)云”,到底是
    的頭像 發(fā)表于 05-21 09:04 ?653次閱讀
    自動駕駛中常提的“<b class='flag-5'>點(diǎn)</b>云”是<b class='flag-5'>個</b>啥?

    C51單片機(jī)及C語言知識點(diǎn)必備秘籍

    單片機(jī)關(guān)鍵知識點(diǎn)一覽: 系列一 1:單片機(jī)簡敘 2:單片機(jī)引腳介紹 3:單片機(jī)存儲器結(jié)構(gòu) 4:第一單片機(jī)小程序 5:單片機(jī)延時程序分析 6:單片機(jī)并行口結(jié)構(gòu) 7:單片機(jī)的特殊
    發(fā)表于 05-15 14:00

    SiC MOSFET驅(qū)動電路設(shè)計的關(guān)鍵點(diǎn)

    柵極驅(qū)動器是確保SiC MOSFET安全運(yùn)行的關(guān)鍵,設(shè)計柵極驅(qū)動電路的關(guān)鍵點(diǎn)包括柵極電阻、柵極電壓和布線方式等,本章節(jié)帶你了解柵極驅(qū)動電壓的影響以及驅(qū)動電源的要求。
    的頭像 發(fā)表于 05-06 15:54 ?1072次閱讀
    SiC MOSFET驅(qū)動電路設(shè)計的<b class='flag-5'>關(guān)鍵</b><b class='flag-5'>點(diǎn)</b>

    如何獲取 OpenAI API Key?API 獲取與代碼調(diào)用示例 (詳解教程)

    ,催生了從智能聊天到復(fù)雜數(shù)據(jù)分析等前所未有的應(yīng)用場景。OpenAI API Key 是開啟這些能力的關(guān)鍵,它既是身份憑證,也是資源管理和安全保障的核心。然而,安全、高效地獲取、管理和使用 API
    的頭像 發(fā)表于 05-04 11:42 ?8338次閱讀
    如何<b class='flag-5'>獲取</b> OpenAI API Key?API <b class='flag-5'>獲取</b>與代碼調(diào)用示例 (詳解教程)

    選購紅外熱像儀的12關(guān)鍵點(diǎn)

    紅外熱像儀作為現(xiàn)代工業(yè)和科技領(lǐng)域不可或缺的工具,其應(yīng)用范圍日益廣泛。然而,面對市場上眾多品牌和型號,如何選購一款既符合預(yù)算又滿足需求的紅外熱像儀呢?小菲將為你詳細(xì)解析選購紅外熱像儀的12關(guān)鍵點(diǎn),助你精準(zhǔn)投資!
    的頭像 發(fā)表于 04-10 14:13 ?639次閱讀

    英偉達(dá)GTC2025大會關(guān)鍵信息點(diǎn)總結(jié) Blackwell Ultra 量子計算與機(jī)器人

    英偉達(dá) GTC 2025 大會關(guān)鍵信息點(diǎn)總結(jié)
    的頭像 發(fā)表于 03-20 14:18 ?1126次閱讀

    深入探索:晶圓級封裝Bump工藝的關(guān)鍵點(diǎn)

    實現(xiàn)芯片與外部電路電氣連接的關(guān)鍵結(jié)構(gòu)。本文將深入解析晶圓級封裝Bump工藝的關(guān)鍵點(diǎn),探討其技術(shù)原理、工藝流程、關(guān)鍵參數(shù)以及面臨的挑戰(zhàn)和解決方案。
    的頭像 發(fā)表于 03-04 10:52 ?3648次閱讀
    深入探索:晶圓級封裝Bump工藝的<b class='flag-5'>關(guān)鍵</b><b class='flag-5'>點(diǎn)</b>

    XenD101H | 人體生命存在感應(yīng)參考設(shè)計

    傳感器特征覆蓋更廣:廣覆蓋兼容掛頂掛壁的檢測方式精準(zhǔn)探測:具備靜臥及睡眠狀態(tài)的人體生命存在感知輕松部署:自動化生成參數(shù)配置,快速適配多樣化場景量產(chǎn)無憂:易用的配套資源,快速導(dǎo)入量
    的頭像 發(fā)表于 12-11 19:16 ?781次閱讀
    XenD101H | <b class='flag-5'>人體</b>生命存在感應(yīng)參考設(shè)計

    ADS1293獲取人體心電信號,如何實現(xiàn)隔直?

    1. ADS1293獲取人體心電信號,如何實現(xiàn)隔直?ECG信號沒有隔直處理的話,基線會偏離0電壓位置,并且不同的人在不同的時間,偏置的電壓不盡相同。 2. ADS1293評估板手冊上,波形十分
    發(fā)表于 12-10 08:25

    常見人體姿態(tài)評估顯示方式的兩種方式

    ,基于Deeplabv3+ 與ResNet34構(gòu)建的一個人體語義分割模型。 火柴人 主要是基于關(guān)鍵點(diǎn)人體姿態(tài)評估顯示方式,基于YOLOv8等人體
    的頭像 發(fā)表于 11-11 11:21 ?903次閱讀
    常見<b class='flag-5'>人體</b>姿態(tài)評估顯示方式的兩種方式