chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

計算機視覺可以學(xué)習(xí)美式手語,進而幫助聽力障礙群體嗎?

新機器視覺 ? 來源:計算機視覺研究院 ? 作者:計算機視覺研究院 ? 2021-04-15 15:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

前言

計算機視覺可以學(xué)習(xí)美式手語,進而幫助聽力障礙群體嗎?數(shù)據(jù)科學(xué)家David Lee用一個項目給出了答案。

如果聽不到了,你會怎么辦?如果只能用手語交流呢?

當(dāng)對方無法理解你時,即使像訂餐、討論財務(wù)事項,甚至和朋友家人對話這樣簡單的事情也可能令你氣餒。對普通人而言輕輕松松的事情對于聽障群體可能是很困難的,他們甚至還會因此遭到歧視。

在很多場景下,他們無法獲取合格的翻譯服務(wù),從而導(dǎo)致失業(yè)、社會隔絕和公共衛(wèi)生問題。為了讓更多人聽到聽障群體的聲音,數(shù)據(jù)科學(xué)家 David Lee 嘗試?yán)脭?shù)據(jù)科學(xué)項目來解決這一問題:計算機視覺可以學(xué)習(xí)美式手語,進而幫助聽力障礙群體嗎?

4b05bf14-9cde-11eb-8b86-12bb97331649.gif

如果通過機器學(xué)習(xí)應(yīng)用可以精確地翻譯美式手語,即使從最基礎(chǔ)的字母表開始,我們也能向著為聽力障礙群體提供更多的便利和教育資源前進一步。

數(shù)據(jù)和項目介紹

出于多種原因,David Lee決定創(chuàng)建一個原始圖像數(shù)據(jù)集。首先,基于移動設(shè)備或攝像頭設(shè)置想要的環(huán)境,需要的分辨率一般是720p或1080p?,F(xiàn)有的幾個數(shù)據(jù)集分辨率較低,而且很多不包括字母「J」和「Z」,因為這兩個字母需要一些動作才能完成。

5049be6c-9cde-11eb-8b86-12bb97331649.png

為此,David Lee 在社交平臺上發(fā)送了手語圖像數(shù)據(jù)收集請求,介紹了這個項目和如何提交手語圖像的說明,希望借此提高大家的認(rèn)識并收集數(shù)據(jù)。

數(shù)據(jù)變形和過采樣

David Lee 為該項目收集了 720 張圖片,其中還有幾張是他自己的手部圖像。由于這個數(shù)據(jù)集規(guī)模較小,于是 David 使用 labelImg 軟件手動進行邊界框標(biāo)記,設(shè)置變換函數(shù)的概率以基于同一張圖像創(chuàng)建多個實例,每個實例上的邊界框有所不同。下圖展示了數(shù)據(jù)增強示例:

508d49fc-9cde-11eb-8b86-12bb97331649.png

經(jīng)過數(shù)據(jù)增強后,該數(shù)據(jù)集的規(guī)模從 720 張圖像擴展到 18,000 張圖像。

建模

David 選擇使用 YOLOv5 進行建模。將數(shù)據(jù)集中 90% 的圖像用作訓(xùn)練數(shù)據(jù),10% 的圖像用作驗證集。使用遷移學(xué)習(xí)和 YOLOv5m 預(yù)訓(xùn)練權(quán)重訓(xùn)練 300 個 epoch。

51b213ee-9cde-11eb-8b86-12bb97331649.jpg

在驗證集上成功創(chuàng)建具備標(biāo)簽和預(yù)測置信度的新邊界框。

51c1af8e-9cde-11eb-8b86-12bb97331649.png

由于損失值并未出現(xiàn)增長,表明模型未過擬合,因此該模型或許可以訓(xùn)練更多輪次。模型最終獲得了 85.27% 的 mAP@.5:.95 分?jǐn)?shù)。

圖像推斷測試

David 額外收集了他兒子的手部圖像數(shù)據(jù)作為測試集。事實上,還沒有兒童手部圖像用于訓(xùn)練該模型。理想情況下,再多幾張圖像有助于展示模型的性能,但這只是個開始。

5234549e-9cde-11eb-8b86-12bb97331649.png

26 個字母中,有 4 個沒有預(yù)測結(jié)果(分別是 G、H、J 和 Z)。四個沒有得到準(zhǔn)確預(yù)測:

D 被預(yù)測為 F;

E 被預(yù)測為 T;

P 被預(yù)測為 Q;

R 被預(yù)測為 U。

視頻推斷測試

4b05bf14-9cde-11eb-8b86-12bb97331649.gif

即使只有幾個手部圖像用于訓(xùn)練,模型仍能在如此小的數(shù)據(jù)集上展現(xiàn)不錯的性能,而且還能以一定的速度提供優(yōu)秀的預(yù)測結(jié)果,這一結(jié)果表現(xiàn)出了很大的潛力。更多數(shù)據(jù)有助于創(chuàng)建可在多種新環(huán)境中使用的模型。如以上視頻所示,即使字母有一部分出框了,模型仍能給出不錯的預(yù)測結(jié)果。最令人驚訝的是,字母 J 和 Z 也得到了準(zhǔn)確識別。

其他測試

執(zhí)行其他一些測試,例如:左手手語測試

5c5be158-9cde-11eb-8b86-12bb97331649.gif

幾乎所有原始圖像都顯示的是右手,但驚喜地發(fā)現(xiàn)數(shù)據(jù)增強在這里起到了作用,因為有 50% 的可能性是針對左手用戶進行水平翻轉(zhuǎn)。

兒童手語測試

6984db3c-9cde-11eb-8b86-12bb97331649.gif

兒童的手語數(shù)據(jù)未被用于訓(xùn)練集,但模型對此仍有不錯的預(yù)測。

多實例

6a320726-9cde-11eb-8b86-12bb97331649.gif

盡管手語的使用和視頻中有所不同,但這個示例表明當(dāng)多個人出現(xiàn)在屏幕上時,模型可以分辨出不止一個手語實例。

模型局限性

發(fā)現(xiàn)該模型還有一些地方有待改進。

距離

6c0830e8-9cde-11eb-8b86-12bb97331649.gif

許多原始圖像是用手機拍攝的,手到攝像頭的距離比較近,這對遠距離推斷有一定負(fù)面影響。

新環(huán)境

83cf19d0-9cde-11eb-8b86-12bb97331649.gif

這支視頻來自于志愿者,未用于模型訓(xùn)練。盡管模型看到過很多字母,但對此的預(yù)測置信度較低,還有一些錯誤分類。

背景推斷

84fc4ef4-9cde-11eb-8b86-12bb97331649.gif

該測試旨在驗證不同的背景會影響模型的性能。

結(jié)論

這個項目表明:計算機視覺可用于幫助聽力障礙群體獲取更多便利和教育資源!該模型在僅使用小型數(shù)據(jù)集的情況下仍能取得不錯的性能。即使對于不同環(huán)境中的不同手部,模型也能實現(xiàn)良好的檢測結(jié)果。

而且一些局限性是可以通過更多訓(xùn)練數(shù)據(jù)得到解決的。經(jīng)過調(diào)整和數(shù)據(jù)集的擴大,該模型或許可以擴展到美式手語字母表以外的場景。

8bee280e-9cde-11eb-8b86-12bb97331649.gif

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 手勢識別
    +關(guān)注

    關(guān)注

    8

    文章

    232

    瀏覽量

    48946
  • 計算機視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1715

    瀏覽量

    47542
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1235

    瀏覽量

    26116

原文標(biāo)題:YOLOv5的項目實踐 | 手勢識別項目落地全過程(附源碼)

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    上海計算機視覺企業(yè)行學(xué)術(shù)沙龍走進西井科技

    12月5日,由中國圖象圖形學(xué)學(xué)會青年工作委員會(下簡稱“青工委”)、上海市計算機學(xué)會計算機視覺專委會(下簡稱“專委會”)聯(lián)合主辦,上海西井科技股份有限公司、江蘇路街道商會承辦的“上海計算機
    的頭像 發(fā)表于 12-16 15:39 ?463次閱讀

    使用代理式AI激活傳統(tǒng)計算機視覺系統(tǒng)的三種方法

    當(dāng)前的計算機視覺系統(tǒng)擅長于識別物理空間與流程中的事件,卻難以詮釋場景細(xì)節(jié)及其意義,也無法推理后續(xù)可能發(fā)生的情況。
    的頭像 發(fā)表于 12-01 09:44 ?566次閱讀

    STM32計算機視覺開發(fā)套件:B-CAMS-IMX攝像頭模塊技術(shù)解析

    STMicroelectronics用于 STM32開發(fā)板的B-CAMS-IMX攝像頭模塊提供強大的硬件集,可處理多種計算機視覺場景和用例。該模塊具有高分辨率500萬像素IMX335LQN
    的頭像 發(fā)表于 10-20 09:46 ?1068次閱讀
    STM32<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>開發(fā)套件:B-CAMS-IMX攝像頭模塊技術(shù)解析

    【作品合集】賽昉科技VisionFive 2單板計算機開發(fā)板測評

    賽昉科技VisionFive 2單板計算機開發(fā)板測評作品合集 產(chǎn)品介紹: 昉·星光 2是全球首款集成了3D GPU的高性能量產(chǎn)RISC-V單板計算機,搭載昉·驚鴻-7110(型號:JH-7110
    發(fā)表于 09-04 09:08

    易控智駕榮獲計算機視覺頂會CVPR 2025認(rèn)可

    近日,2025年國際計算機視覺與模式識別頂級會議(IEEE/CVF Conference on Computer Vision and Pattern Recognition,CVPR 2025)在美國田納西州納什維爾召開。
    的頭像 發(fā)表于 07-29 16:54 ?1115次閱讀

    工業(yè)計算機的重要性

    工業(yè)計算機對某些行業(yè)至關(guān)重要。我們將在下面詳細(xì)解釋這些行業(yè)中的工業(yè)計算機應(yīng)用。1.制造與工業(yè)自動化工業(yè)級計算機非常適合制造工廠,特別是那些想要自動化裝配過程的工廠。在這樣的環(huán)境中,工業(yè)計算機
    的頭像 發(fā)表于 07-28 16:07 ?483次閱讀
    工業(yè)<b class='flag-5'>計算機</b>的重要性

    自動化計算機經(jīng)過加固后有什么好處?

    讓我們討論一下部署堅固的自動化計算機的一些好處。1.溫度范圍寬自動化計算機經(jīng)過工程設(shè)計,配備了支持寬溫度范圍的組件,使自動化計算解決方案能夠在各種不同的極端環(huán)境中運行。自動化計算機能夠
    的頭像 發(fā)表于 07-21 16:44 ?535次閱讀
    自動化<b class='flag-5'>計算機</b>經(jīng)過加固后有什么好處?

    自動化計算機的功能與用途

    工業(yè)自動化是指利用自動化計算機來控制工業(yè)環(huán)境中的流程、機器人和機械,以制造產(chǎn)品或其部件。工業(yè)自動化的目的是提高生產(chǎn)率、增加靈活性,并提升制造過程的質(zhì)量。工業(yè)自動化在汽車制造中體現(xiàn)得最為明顯,其中許多
    的頭像 發(fā)表于 07-15 16:32 ?640次閱讀
    自動化<b class='flag-5'>計算機</b>的功能與用途

    工業(yè)計算機與商用計算機的區(qū)別有哪些

    工業(yè)計算機是一種專為工廠和工業(yè)環(huán)境設(shè)計的計算系統(tǒng),具有高可靠性和穩(wěn)定性,能夠應(yīng)對惡劣環(huán)境下的自動化、制造和機器人操作。其特點包括無風(fēng)扇散熱技術(shù)、無電纜連接和防塵防水設(shè)計,使其在各種工業(yè)自動化場景中
    的頭像 發(fā)表于 07-10 16:36 ?631次閱讀
    工業(yè)<b class='flag-5'>計算機</b>與商用<b class='flag-5'>計算機</b>的區(qū)別有哪些

    一文帶你了解工業(yè)計算機尺寸

    工業(yè)計算機是現(xiàn)代自動化、人工智能(AI)和邊緣計算的支柱。這些堅固耐用的系統(tǒng)旨在承受惡劣的環(huán)境,同時為關(guān)鍵應(yīng)用提供可靠的性能。然而,由于有這么多可用的外形尺寸,為您的工業(yè)計算機選擇合適的尺寸可能是
    的頭像 發(fā)表于 04-24 13:35 ?917次閱讀
    一文帶你了解工業(yè)<b class='flag-5'>計算機</b>尺寸

    計算機網(wǎng)絡(luò)入門指南

    計算機網(wǎng)絡(luò)是指將地理位置不同且具有獨立功能的多臺計算機及其外部設(shè)備,通過通信線路連接起來,在網(wǎng)絡(luò)操作系統(tǒng)、網(wǎng)絡(luò)管理軟件及網(wǎng)絡(luò)通信協(xié)議的管理和協(xié)調(diào)下,實現(xiàn)資源共享和信息傳遞的計算機系統(tǒng)。
    的頭像 發(fā)表于 04-22 14:29 ?2017次閱讀
    <b class='flag-5'>計算機</b>網(wǎng)絡(luò)入門指南

    英飛凌邊緣AI平臺通過Ultralytics YOLO模型增加對計算機視覺的支持

    計算機視覺的支持,擴大了當(dāng)前對音頻、雷達和其他時間序列信號數(shù)據(jù)的支持范圍。在增加這項支持后,該平臺將能夠用于開發(fā)低功耗、低內(nèi)存的邊緣AI視覺模型。這將給諸多應(yīng)用領(lǐng)域的機器學(xué)習(xí)開發(fā)人員
    的頭像 發(fā)表于 03-11 15:11 ?734次閱讀
    英飛凌邊緣AI平臺通過Ultralytics YOLO模型增加對<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>的支持

    Arm KleidiCV與OpenCV集成助力移動端計算機視覺性能優(yōu)化

    生成式及多模態(tài)人工智能 (AI) 工作負(fù)載的廣泛增長,推動了對計算機視覺 (CV) 技術(shù)日益高漲的需求。此類技術(shù)能夠解釋并分析源自現(xiàn)實世界的視覺信息,并可應(yīng)用于人臉識別、照片分類、濾鏡處理及增強現(xiàn)實
    的頭像 發(fā)表于 02-24 10:15 ?994次閱讀

    AR和VR中的計算機視覺

    ):計算機視覺引領(lǐng)混合現(xiàn)實體驗增強現(xiàn)實(AR)和虛擬現(xiàn)實(VR)正在徹底改變我們與外部世界的互動方式。即便是在引人入勝的沉浸式
    的頭像 發(fā)表于 02-08 14:29 ?2315次閱讀
    AR和VR中的<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>