chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

小米AI實(shí)驗(yàn)室聲學(xué)團(tuán)隊(duì) 獲嬰兒啼哭聲識(shí)別的挑戰(zhàn)賽任務(wù)第一名

小米公司 ? 來(lái)源:小米公司 ? 作者:小米公司 ? 2020-11-13 10:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

對(duì)嬰兒來(lái)說(shuō),啼哭聲是一種通訊的方式,一個(gè)非常有限、但類似成年人進(jìn)行交流的方式。它也是一種生物報(bào)警器,向外界傳達(dá)著嬰兒生理和心理的需求。 基于啼哭聲聲波攜帶的信息,嬰兒的身體狀況才能被確定,疾病才能被檢測(cè)出來(lái)。因此,有效辨識(shí)啼哭聲,成功地將嬰兒啼哭聲“翻譯”成“成人語(yǔ)言”,讓成年人讀懂啼哭聲的含義,有重大的實(shí)際意義。 2020 iFLYTEK A.I.開(kāi)發(fā)者大賽中,有一項(xiàng)關(guān)于嬰兒啼哭聲識(shí)別的挑戰(zhàn)賽任務(wù)。本次競(jìng)賽總共吸引了678只隊(duì)伍參賽,分別來(lái)自國(guó)內(nèi)不同的公司和高校。最終小米AI實(shí)驗(yàn)室聲學(xué)團(tuán)隊(duì)以0.99123分的高分奪得第一名。

比賽的訓(xùn)練數(shù)據(jù)集包含了awake(蘇醒)、diaper(換尿布)、hug(要抱抱)、hungry(饑餓)、sleepy(困乏)和uncomfortable(不舒服)六類哭聲,并且人工添加了來(lái)自Noisex-92標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)的噪聲。 這項(xiàng)任務(wù)旨在判別嬰兒啼哭聲所傳遞的信息,需要分別在簡(jiǎn)單噪聲環(huán)境和復(fù)雜噪聲環(huán)境下對(duì)嬰兒啼哭進(jìn)行識(shí)別,判斷容易引起混淆的啼哭聲,分析各類啼哭聲的明顯特征及簡(jiǎn)單直接的判別方式。 初賽訓(xùn)練數(shù)據(jù)包含918條音頻,測(cè)試集包含228條。復(fù)賽賽方提供了添加不同噪聲的30294條訓(xùn)練數(shù)據(jù),需對(duì)7524條測(cè)試音頻進(jìn)行識(shí)別。

嬰兒啼哭比賽背后的技術(shù)原理 小米AI實(shí)驗(yàn)室聲學(xué)團(tuán)隊(duì)借鑒說(shuō)話人確認(rèn)的方法,訓(xùn)練網(wǎng)絡(luò)使得vector的余弦距在離類間間距拉大而類內(nèi)間距減小。 在模型的訓(xùn)練過(guò)程中,首先使用VAD算法對(duì)嬰兒啼哭音頻中的靜音部分進(jìn)行剔除。去除靜音后隨機(jī)選取160幀,不足160幀的語(yǔ)音采用Cycle Padding方式,利用中間特征進(jìn)行循環(huán)填充,相比與傳統(tǒng)的補(bǔ)0或用尾部填充的方式,特征更加豐富。 模型采用3 層 LSTM+256Dense 層,每層節(jié)點(diǎn)為 512。初賽訓(xùn)練集中的所有純凈語(yǔ)音均看作 enroll 語(yǔ)料,所有訓(xùn)練集中每個(gè)類別的 embedding 由該類別中的所有語(yǔ)音過(guò)模型求整體平均得到。測(cè)試集中的每條語(yǔ)音過(guò)模型后得到的 embedding與 enroll 中的每類 embedding 求余弦距離,分?jǐn)?shù)對(duì)應(yīng)最高的類別為預(yù)測(cè)類別。 訓(xùn)練策略為:首先迭代第一個(gè) 5000 次,學(xué)習(xí)率設(shè)置為 1e-3,第二次加載預(yù)訓(xùn)練模型(mAp 分?jǐn)?shù)高的),調(diào)整學(xué)習(xí)率,再迭代 5000 次,最終交叉加載預(yù)訓(xùn)練模型在不同的 part 上訓(xùn)練。

模型的選擇和推理過(guò)程分為以下4個(gè)步驟:

測(cè)試集統(tǒng)計(jì)分析:首先統(tǒng)計(jì)測(cè)試集語(yǔ)音的信噪比、時(shí)長(zhǎng)、靜音占比及語(yǔ)音相似度。通過(guò)對(duì)比分析,對(duì)相似數(shù)據(jù)進(jìn)行歸類,選取最高信噪比數(shù)據(jù)進(jìn)行預(yù)測(cè)。

模型選擇:在 5 個(gè)訓(xùn)練集上分別擇優(yōu)選取 2 個(gè)模型作為備用。

推理:計(jì)算測(cè)試語(yǔ)料經(jīng)模型推理得到的vector 與每類哭聲embedding間的余弦距離,取分?jǐn)?shù)最高的對(duì)應(yīng)類為備選結(jié)果。

投票:根據(jù)單個(gè)模型預(yù)測(cè)的結(jié)果投票得到最終結(jié)果。

聲學(xué)感知技術(shù)未來(lái)將如何發(fā)展? 當(dāng)前主流的聲學(xué)感知技術(shù)使用的是強(qiáng)監(jiān)督的深度學(xué)習(xí)方法,隨著數(shù)據(jù)量的增大和技術(shù)的發(fā)展,未來(lái)監(jiān)督學(xué)習(xí)的方法將逐漸過(guò)度為半監(jiān)督甚至無(wú)監(jiān)督學(xué)習(xí)。其中半監(jiān)督學(xué)習(xí)正是當(dāng)前聲音事件檢測(cè)技術(shù)的研究重點(diǎn)。 不僅如此,深度學(xué)習(xí)的網(wǎng)絡(luò)模型也從人工專家設(shè)計(jì)逐漸轉(zhuǎn)變?yōu)樽詣?dòng)搜索架構(gòu),而元學(xué)習(xí)等小樣本學(xué)習(xí)方法也開(kāi)始逐步應(yīng)用在聲學(xué)感知方向。 嬰兒哭聲分析只是聲學(xué)感知技術(shù)的其中一個(gè)應(yīng)用。當(dāng)前的聲音場(chǎng)景分類和聲音事件檢測(cè)技術(shù)已能在設(shè)備端上實(shí)時(shí)分析當(dāng)前用戶所處的場(chǎng)景和識(shí)別出各式各樣的聲音,如貓狗寵物叫聲、警報(bào)聲、汽車?guó)Q笛聲等。

不僅如此,聲學(xué)感知技術(shù)還能分析出一些連人耳也無(wú)法聽(tīng)出的聲音,如本次競(jìng)賽的嬰兒啼哭意圖,以及應(yīng)用在工業(yè)上,通過(guò)分析機(jī)器發(fā)出的聲音來(lái)判斷機(jī)器保養(yǎng)狀態(tài)的聲學(xué)分析技術(shù)。聲音作為一種最常見(jiàn)的傳感媒介之一,聲音感知技術(shù)在智能家庭、自動(dòng)駕駛、智能工業(yè)化等領(lǐng)域都有廣泛的應(yīng)用場(chǎng)景。 手機(jī)xAIoT小米AI全力打造小米智能家居 隨著小米最新的手機(jī)xAIoT戰(zhàn)略,智能家居環(huán)境是手機(jī)設(shè)備與全部智能家居設(shè)備聯(lián)動(dòng)最全面的使用場(chǎng)景。手機(jī)、TWS耳機(jī)和越來(lái)越多的智能家居設(shè)備比如智能音箱、智能電視、米家IoT設(shè)備等都具有麥克風(fēng)拾音功能。 我們獲得了足夠多場(chǎng)景下的聲音數(shù)據(jù)時(shí),構(gòu)建基于設(shè)備端的場(chǎng)景感知、事件感知、人體感知和空間感知能力成為了可能。 依賴于全球第一的AIoT平臺(tái),小米可以實(shí)現(xiàn)對(duì)家中每一個(gè)角落無(wú)處不在的感知能力,并完成手機(jī)端事件提醒與多事件時(shí)間線回溯,聲學(xué)作為智能感知的一種手段,在未來(lái)與UWB技術(shù)、視覺(jué)圖像技術(shù)相結(jié)合,相互取長(zhǎng)補(bǔ)短將成為主流的趨勢(shì)。

責(zé)任編輯:xj

原文標(biāo)題:小米AI實(shí)驗(yàn)室聲學(xué)團(tuán)隊(duì)榮獲2020 iFLYTEK A.I.開(kāi)發(fā)者大賽嬰兒啼哭聲識(shí)別挑戰(zhàn)賽冠軍

文章出處:【微信公眾號(hào):小米公司】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39126

    瀏覽量

    299784
  • 智能語(yǔ)音
    +關(guān)注

    關(guān)注

    11

    文章

    824

    瀏覽量

    50162
  • 小米
    +關(guān)注

    關(guān)注

    70

    文章

    14528

    瀏覽量

    151647

原文標(biāo)題:小米AI實(shí)驗(yàn)室聲學(xué)團(tuán)隊(duì)榮獲2020 iFLYTEK A.I.開(kāi)發(fā)者大賽嬰兒啼哭聲識(shí)別挑戰(zhàn)賽冠軍

文章出處:【微信號(hào):xiaomigongsi0406,微信公眾號(hào):小米公司】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    禮來(lái)與NVIDIA宣布成立AI聯(lián)合創(chuàng)新實(shí)驗(yàn)室以應(yīng)對(duì)藥物研發(fā)挑戰(zhàn)

    NVIDIA 與禮來(lái)公司在今日共同宣布,將合作成立家開(kāi)創(chuàng)性的 AI 聯(lián)合創(chuàng)新實(shí)驗(yàn)室,致力于運(yùn)用 AI 技術(shù)解決制藥行業(yè)長(zhǎng)期面臨的諸多挑戰(zhàn)。
    的頭像 發(fā)表于 01-20 09:44 ?185次閱讀

    “芯”年來(lái)襲 | 瑞薩邊緣AI線上技術(shù)月暨挑戰(zhàn)賽

    自1月7日起,瑞薩邊緣AI技術(shù)月活動(dòng)將每周開(kāi)啟場(chǎng)在線技術(shù)交流,涵蓋MCU/MPU產(chǎn)品、應(yīng)用案例及開(kāi)發(fā)實(shí)踐,并同步開(kāi)啟瑞薩AI評(píng)測(cè)挑戰(zhàn)賽,借助教程資源及每周在線講解和答疑,幫助嵌入式開(kāi)
    的頭像 發(fā)表于 12-25 10:21 ?1986次閱讀
    “芯”年來(lái)襲 | 瑞薩邊緣<b class='flag-5'>AI</b>線上技術(shù)月暨<b class='flag-5'>挑戰(zhàn)賽</b>

    隼眼科技獲得第六屆綜合交通創(chuàng)新創(chuàng)業(yè)大賽總決賽第一名

    由中交集團(tuán)舉辦的第六屆綜合交通創(chuàng)新創(chuàng)業(yè)大賽總決賽于12月16日落下帷幕,隼眼科技參賽的“基于92-94GHz毫米波雷達(dá)的全天候感知系統(tǒng)”獲得了第一名的好成績(jī)。
    的頭像 發(fā)表于 12-18 17:07 ?569次閱讀

    告別誤判!WTK6900HD高抗噪哭聲識(shí)別芯片,重塑智能嬰童監(jiān)護(hù)新標(biāo)準(zhǔn)

    當(dāng)90%的精準(zhǔn)識(shí)別率遇上1秒快速響應(yīng),嬰兒哭聲檢測(cè)技術(shù)正在經(jīng)歷從“聽(tīng)見(jiàn)響動(dòng)”到“聽(tīng)懂需求”的根本性變革。深夜的臥室里,智能監(jiān)護(hù)設(shè)備因幾十米外的汽車?guó)Q笛而誤報(bào)警,而嬰兒床上真實(shí)的
    的頭像 發(fā)表于 12-10 09:22 ?598次閱讀
    告別誤判!WTK6900HD高抗噪<b class='flag-5'>哭聲</b><b class='flag-5'>識(shí)別</b>芯片,重塑智能嬰童監(jiān)護(hù)新標(biāo)準(zhǔn)

    傳音TEX AI團(tuán)隊(duì)斬獲ICCV 2025大型視頻目標(biāo)分割挑戰(zhàn)賽雙料亞軍

    近日,國(guó)際計(jì)算機(jī)視覺(jué)大會(huì)(ICCV 2025)舉辦了第七屆大型視頻目標(biāo)分割挑戰(zhàn)賽(LSVOS Challenge),傳音TEX AI團(tuán)隊(duì)憑借自主研發(fā)的創(chuàng)新技術(shù)方案,在復(fù)雜視頻目標(biāo)分割和語(yǔ)言指引視頻
    的頭像 發(fā)表于 10-31 09:42 ?460次閱讀
    傳音TEX <b class='flag-5'>AI</b><b class='flag-5'>團(tuán)隊(duì)</b>斬獲ICCV 2025大型視頻目標(biāo)分割<b class='flag-5'>挑戰(zhàn)賽</b>雙料亞軍

    WTK6900HD哭聲識(shí)別產(chǎn)品在中嬰兒產(chǎn)品中的應(yīng)用

    本文將深入介紹唯創(chuàng)知音推出的WTK6900HD語(yǔ)音識(shí)別芯片如何在嬰兒哭聲識(shí)別領(lǐng)域掀起場(chǎng)技術(shù)革命。
    的頭像 發(fā)表于 10-10 16:50 ?491次閱讀
    WTK6900HD<b class='flag-5'>哭聲</b><b class='flag-5'>識(shí)別</b>產(chǎn)品在中<b class='flag-5'>嬰兒</b>產(chǎn)品中的應(yīng)用

    東風(fēng)本田CR-V榮獲2025合資SUV質(zhì)量體驗(yàn)第一名

    近日,2025年中國(guó)汽車產(chǎn)品質(zhì)量表現(xiàn)研究(AQR)結(jié)果發(fā)布暨頒獎(jiǎng)典禮圓滿落幕。東風(fēng)本田CR-V憑借卓越的質(zhì)量表現(xiàn),榮獲“合資SUV質(zhì)量體驗(yàn)第一名”的桂冠,這權(quán)威獎(jiǎng)項(xiàng)不僅是對(duì)東風(fēng)本田CR-V的肯定,更是對(duì)品牌在質(zhì)量、品質(zhì)等方面多年堅(jiān)守“長(zhǎng)期主義”的最佳褒獎(jiǎng)。
    的頭像 發(fā)表于 10-09 09:56 ?524次閱讀

    地平線H-RDT模型斬獲CVPR 2025大冠軍

    近日,在計(jì)算機(jī)視覺(jué)與模式識(shí)別領(lǐng)域頂級(jí)會(huì)議CVPR 2025舉辦的RoboTwin雙臂機(jī)器人競(jìng)賽中,地平線機(jī)器人實(shí)驗(yàn)室與清華大學(xué)計(jì)算機(jī)系朱軍團(tuán)隊(duì)聯(lián)合提出的H-RDT憑強(qiáng)大性能和領(lǐng)先成功率,
    的頭像 發(fā)表于 08-21 10:02 ?553次閱讀
    地平線H-RDT模型斬獲CVPR 2025大<b class='flag-5'>賽</b>冠軍

    尼特獲得DEKRA德凱CTF1實(shí)驗(yàn)室認(rèn)證

    近日,寧波尼特照明電器有限公司正式通過(guò)DEKRA德凱嚴(yán)格審核,成功獲得CTF1實(shí)驗(yàn)室認(rèn)可資質(zhì)。本次頒證儀式由DEKRA德凱上海照明事業(yè)部總監(jiān)厲梁與寧波尼特照明電器有限公司實(shí)驗(yàn)室負(fù)責(zé)
    的頭像 發(fā)表于 08-07 14:54 ?957次閱讀

    軟通動(dòng)力斬獲2024年中國(guó)IT服務(wù)市場(chǎng)份額第一名

    近日,迪顧問(wèn)發(fā)布《2024-2025年中國(guó)信息技術(shù)服務(wù)市場(chǎng)研究年度報(bào)告》。軟通動(dòng)力憑借在智能化轉(zhuǎn)型浪潮中的卓越表現(xiàn),以領(lǐng)先的數(shù)智化能力持續(xù)領(lǐng)跑中國(guó)IT服務(wù)市場(chǎng),不僅斬獲2024年市場(chǎng)份額第一名,更在IT咨詢、IT運(yùn)維等核心領(lǐng)域鞏固優(yōu)勢(shì),綜合競(jìng)爭(zhēng)力持續(xù)提升。
    的頭像 發(fā)表于 08-01 17:53 ?1841次閱讀

    潤(rùn)和軟件穩(wěn)居數(shù)字業(yè)務(wù)類解決方案市場(chǎng)第一名

    ”)憑借自身卓越的技術(shù)實(shí)力和創(chuàng)新能力,連續(xù)五年穩(wěn)居數(shù)字業(yè)務(wù)類解決方案市場(chǎng)第一名;在細(xì)分領(lǐng)域:數(shù)字信貸系統(tǒng)解決方案子市場(chǎng)持續(xù)保持第一名,數(shù)字銀行解決方案子市場(chǎng)躍升至第一名。同時(shí),其在開(kāi)放銀行、交易銀行、智能營(yíng)銷、智能風(fēng)控、數(shù)據(jù)智能
    的頭像 發(fā)表于 07-14 17:36 ?1283次閱讀

    傳音多媒體團(tuán)隊(duì)CVPR NTIRE 2025兩項(xiàng)挑戰(zhàn)賽冠亞軍,推動(dòng)視頻畫質(zhì)升級(jí)

    (NTIRE2025EfficientSuper-ResolutionChallenge)第一名,短視頻UGC圖像超分辨率挑戰(zhàn)賽(NTIRE2025Short-formUGCImageSuper-Reso
    的頭像 發(fā)表于 06-24 17:03 ?836次閱讀
    傳音多媒體<b class='flag-5'>團(tuán)隊(duì)</b>攬<b class='flag-5'>獲</b>CVPR NTIRE 2025兩項(xiàng)<b class='flag-5'>挑戰(zhàn)賽</b>冠亞軍,推動(dòng)視頻畫質(zhì)升級(jí)

    傳音多媒體團(tuán)隊(duì)CVPR NTIRE 2025兩項(xiàng)挑戰(zhàn)賽冠亞軍

    Efficient Super-Resolution Challenge)第一名,短視頻UGC圖像超分辨率挑戰(zhàn)賽(NTIRE 2025 Short-form UGC Image Super-Resolution
    的頭像 發(fā)表于 06-24 16:08 ?1512次閱讀
    傳音多媒體<b class='flag-5'>團(tuán)隊(duì)</b>攬<b class='flag-5'>獲</b>CVPR NTIRE 2025兩項(xiàng)<b class='flag-5'>挑戰(zhàn)賽</b>冠亞軍

    華為榮登GlobalData運(yùn)營(yíng)商基礎(chǔ)設(shè)施管理服務(wù)排名報(bào)告Leader象限第一名

    象限第一名。 報(bào)告對(duì)通信服務(wù)商從商業(yè)模式、解決方案、網(wǎng)絡(luò)設(shè)計(jì)與優(yōu)化、網(wǎng)絡(luò)轉(zhuǎn)型能力、服務(wù)規(guī)模、和業(yè)務(wù)敏捷性六個(gè)維度進(jìn)行了全面評(píng)估,華為綜合得分第一。這印證了華為在對(duì)全球運(yùn)營(yíng)商客戶提供領(lǐng)先服務(wù)解決方案、網(wǎng)絡(luò)極致性能和數(shù)智化轉(zhuǎn)型等方面做出了卓越
    的頭像 發(fā)表于 05-22 18:43 ?1011次閱讀
    華為榮登GlobalData運(yùn)營(yíng)商基礎(chǔ)設(shè)施管理服務(wù)排名報(bào)告Leader象限<b class='flag-5'>第一名</b>

    微軟AI開(kāi)發(fā)者挑戰(zhàn)賽即將開(kāi)啟

    人工智能,正在重塑世界。2 月 5 日至 4 月 23 日,加入我們,共赴場(chǎng)聚焦 AI 技術(shù)的開(kāi)發(fā)者挑戰(zhàn)賽!在這里,創(chuàng)意、技術(shù)和無(wú)限可能將碰撞出耀眼火花。無(wú)論你是開(kāi)發(fā)新秀還是經(jīng)驗(yàn)豐富的技術(shù)專家,這場(chǎng)由微軟 Azure 驅(qū)動(dòng)的在
    的頭像 發(fā)表于 02-12 16:18 ?749次閱讀