chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

小米AI實驗室聲學(xué)團隊 獲嬰兒啼哭聲識別的挑戰(zhàn)賽任務(wù)第一名

小米公司 ? 來源:小米公司 ? 作者:小米公司 ? 2020-11-13 10:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

對嬰兒來說,啼哭聲是一種通訊的方式,一個非常有限、但類似成年人進行交流的方式。它也是一種生物報警器,向外界傳達著嬰兒生理和心理的需求。 基于啼哭聲聲波攜帶的信息,嬰兒的身體狀況才能被確定,疾病才能被檢測出來。因此,有效辨識啼哭聲,成功地將嬰兒啼哭聲“翻譯”成“成人語言”,讓成年人讀懂啼哭聲的含義,有重大的實際意義。 2020 iFLYTEK A.I.開發(fā)者大賽中,有一項關(guān)于嬰兒啼哭聲識別的挑戰(zhàn)賽任務(wù)。本次競賽總共吸引了678只隊伍參賽,分別來自國內(nèi)不同的公司和高校。最終小米AI實驗室聲學(xué)團隊以0.99123分的高分奪得第一名。

比賽的訓(xùn)練數(shù)據(jù)集包含了awake(蘇醒)、diaper(換尿布)、hug(要抱抱)、hungry(饑餓)、sleepy(困乏)和uncomfortable(不舒服)六類哭聲,并且人工添加了來自Noisex-92標準數(shù)據(jù)庫的噪聲。 這項任務(wù)旨在判別嬰兒啼哭聲所傳遞的信息,需要分別在簡單噪聲環(huán)境和復(fù)雜噪聲環(huán)境下對嬰兒啼哭進行識別,判斷容易引起混淆的啼哭聲,分析各類啼哭聲的明顯特征及簡單直接的判別方式。 初賽訓(xùn)練數(shù)據(jù)包含918條音頻,測試集包含228條。復(fù)賽賽方提供了添加不同噪聲的30294條訓(xùn)練數(shù)據(jù),需對7524條測試音頻進行識別。

嬰兒啼哭比賽背后的技術(shù)原理 小米AI實驗室聲學(xué)團隊借鑒說話人確認的方法,訓(xùn)練網(wǎng)絡(luò)使得vector的余弦距在離類間間距拉大而類內(nèi)間距減小。 在模型的訓(xùn)練過程中,首先使用VAD算法對嬰兒啼哭音頻中的靜音部分進行剔除。去除靜音后隨機選取160幀,不足160幀的語音采用Cycle Padding方式,利用中間特征進行循環(huán)填充,相比與傳統(tǒng)的補0或用尾部填充的方式,特征更加豐富。 模型采用3 層 LSTM+256Dense 層,每層節(jié)點為 512。初賽訓(xùn)練集中的所有純凈語音均看作 enroll 語料,所有訓(xùn)練集中每個類別的 embedding 由該類別中的所有語音過模型求整體平均得到。測試集中的每條語音過模型后得到的 embedding與 enroll 中的每類 embedding 求余弦距離,分數(shù)對應(yīng)最高的類別為預(yù)測類別。 訓(xùn)練策略為:首先迭代第一個 5000 次,學(xué)習率設(shè)置為 1e-3,第二次加載預(yù)訓(xùn)練模型(mAp 分數(shù)高的),調(diào)整學(xué)習率,再迭代 5000 次,最終交叉加載預(yù)訓(xùn)練模型在不同的 part 上訓(xùn)練。

模型的選擇和推理過程分為以下4個步驟:

測試集統(tǒng)計分析:首先統(tǒng)計測試集語音的信噪比、時長、靜音占比及語音相似度。通過對比分析,對相似數(shù)據(jù)進行歸類,選取最高信噪比數(shù)據(jù)進行預(yù)測。

模型選擇:在 5 個訓(xùn)練集上分別擇優(yōu)選取 2 個模型作為備用。

推理:計算測試語料經(jīng)模型推理得到的vector 與每類哭聲embedding間的余弦距離,取分數(shù)最高的對應(yīng)類為備選結(jié)果。

投票:根據(jù)單個模型預(yù)測的結(jié)果投票得到最終結(jié)果。

聲學(xué)感知技術(shù)未來將如何發(fā)展? 當前主流的聲學(xué)感知技術(shù)使用的是強監(jiān)督的深度學(xué)習方法,隨著數(shù)據(jù)量的增大和技術(shù)的發(fā)展,未來監(jiān)督學(xué)習的方法將逐漸過度為半監(jiān)督甚至無監(jiān)督學(xué)習。其中半監(jiān)督學(xué)習正是當前聲音事件檢測技術(shù)的研究重點。 不僅如此,深度學(xué)習的網(wǎng)絡(luò)模型也從人工專家設(shè)計逐漸轉(zhuǎn)變?yōu)樽詣铀阉骷軜?gòu),而元學(xué)習等小樣本學(xué)習方法也開始逐步應(yīng)用在聲學(xué)感知方向。 嬰兒哭聲分析只是聲學(xué)感知技術(shù)的其中一個應(yīng)用。當前的聲音場景分類和聲音事件檢測技術(shù)已能在設(shè)備端上實時分析當前用戶所處的場景和識別出各式各樣的聲音,如貓狗寵物叫聲、警報聲、汽車鳴笛聲等。

不僅如此,聲學(xué)感知技術(shù)還能分析出一些連人耳也無法聽出的聲音,如本次競賽的嬰兒啼哭意圖,以及應(yīng)用在工業(yè)上,通過分析機器發(fā)出的聲音來判斷機器保養(yǎng)狀態(tài)的聲學(xué)分析技術(shù)。聲音作為一種最常見的傳感媒介之一,聲音感知技術(shù)在智能家庭、自動駕駛、智能工業(yè)化等領(lǐng)域都有廣泛的應(yīng)用場景。 手機xAIoT小米AI全力打造小米智能家居 隨著小米最新的手機xAIoT戰(zhàn)略,智能家居環(huán)境是手機設(shè)備與全部智能家居設(shè)備聯(lián)動最全面的使用場景。手機、TWS耳機和越來越多的智能家居設(shè)備比如智能音箱、智能電視、米家IoT設(shè)備等都具有麥克風拾音功能。 我們獲得了足夠多場景下的聲音數(shù)據(jù)時,構(gòu)建基于設(shè)備端的場景感知、事件感知、人體感知和空間感知能力成為了可能。 依賴于全球第一的AIoT平臺,小米可以實現(xiàn)對家中每一個角落無處不在的感知能力,并完成手機端事件提醒與多事件時間線回溯,聲學(xué)作為智能感知的一種手段,在未來與UWB技術(shù)、視覺圖像技術(shù)相結(jié)合,相互取長補短將成為主流的趨勢。

責任編輯:xj

原文標題:小米AI實驗室聲學(xué)團隊榮獲2020 iFLYTEK A.I.開發(fā)者大賽嬰兒啼哭聲識別挑戰(zhàn)賽冠軍

文章出處:【微信公眾號:小米公司】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    37165

    瀏覽量

    291453
  • 智能語音
    +關(guān)注

    關(guān)注

    11

    文章

    819

    瀏覽量

    49913
  • 小米
    +關(guān)注

    關(guān)注

    70

    文章

    14505

    瀏覽量

    150525

原文標題:小米AI實驗室聲學(xué)團隊榮獲2020 iFLYTEK A.I.開發(fā)者大賽嬰兒啼哭聲識別挑戰(zhàn)賽冠軍

文章出處:【微信號:xiaomigongsi0406,微信公眾號:小米公司】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    WTK6900HD哭聲識別產(chǎn)品在中嬰兒產(chǎn)品中的應(yīng)用

    本文將深入介紹唯創(chuàng)知音推出的WTK6900HD語音識別芯片如何在嬰兒哭聲識別領(lǐng)域掀起場技術(shù)革命。
    的頭像 發(fā)表于 10-10 16:50 ?299次閱讀
    WTK6900HD<b class='flag-5'>哭聲</b><b class='flag-5'>識別</b>產(chǎn)品在中<b class='flag-5'>嬰兒</b>產(chǎn)品中的應(yīng)用

    東風本田CR-V榮獲2025合資SUV質(zhì)量體驗第一名

    近日,2025年中國汽車產(chǎn)品質(zhì)量表現(xiàn)研究(AQR)結(jié)果發(fā)布暨頒獎典禮圓滿落幕。東風本田CR-V憑借卓越的質(zhì)量表現(xiàn),榮獲“合資SUV質(zhì)量體驗第一名”的桂冠,這權(quán)威獎項不僅是對東風本田CR-V的肯定,更是對品牌在質(zhì)量、品質(zhì)等方面多年堅守“長期主義”的最佳褒獎。
    的頭像 發(fā)表于 10-09 09:56 ?229次閱讀

    地平線H-RDT模型斬獲CVPR 2025大冠軍

    近日,在計算機視覺與模式識別領(lǐng)域頂級會議CVPR 2025舉辦的RoboTwin雙臂機器人競賽中,地平線機器人實驗室與清華大學(xué)計算機系朱軍團隊聯(lián)合提出的H-RDT憑強大性能和領(lǐng)先成功率,
    的頭像 發(fā)表于 08-21 10:02 ?337次閱讀
    地平線H-RDT模型斬獲CVPR 2025大<b class='flag-5'>賽</b>冠軍

    尼特獲得DEKRA德凱CTF1實驗室認證

    近日,寧波尼特照明電器有限公司正式通過DEKRA德凱嚴格審核,成功獲得CTF1實驗室認可資質(zhì)。本次頒證儀式由DEKRA德凱上海照明事業(yè)部總監(jiān)厲梁與寧波尼特照明電器有限公司實驗室負責
    的頭像 發(fā)表于 08-07 14:54 ?693次閱讀

    軟通動力斬獲2024年中國IT服務(wù)市場份額第一名

    近日,迪顧問發(fā)布《2024-2025年中國信息技術(shù)服務(wù)市場研究年度報告》。軟通動力憑借在智能化轉(zhuǎn)型浪潮中的卓越表現(xiàn),以領(lǐng)先的數(shù)智化能力持續(xù)領(lǐng)跑中國IT服務(wù)市場,不僅斬獲2024年市場份額第一名,更在IT咨詢、IT運維等核心領(lǐng)域鞏固優(yōu)勢,綜合競爭力持續(xù)提升。
    的頭像 發(fā)表于 08-01 17:53 ?1513次閱讀

    潤和軟件穩(wěn)居數(shù)字業(yè)務(wù)類解決方案市場第一名

    ”)憑借自身卓越的技術(shù)實力和創(chuàng)新能力,連續(xù)五年穩(wěn)居數(shù)字業(yè)務(wù)類解決方案市場第一名;在細分領(lǐng)域:數(shù)字信貸系統(tǒng)解決方案子市場持續(xù)保持第一名,數(shù)字銀行解決方案子市場躍升至第一名。同時,其在開放銀行、交易銀行、智能營銷、智能風控、數(shù)據(jù)智能
    的頭像 發(fā)表于 07-14 17:36 ?977次閱讀

    傳音多媒體團隊CVPR NTIRE 2025兩項挑戰(zhàn)賽冠亞軍,推動視頻畫質(zhì)升級

    (NTIRE2025EfficientSuper-ResolutionChallenge)第一名,短視頻UGC圖像超分辨率挑戰(zhàn)賽(NTIRE2025Short-formUGCImageSuper-Reso
    的頭像 發(fā)表于 06-24 17:03 ?653次閱讀
    傳音多媒體<b class='flag-5'>團隊</b>攬<b class='flag-5'>獲</b>CVPR NTIRE 2025兩項<b class='flag-5'>挑戰(zhàn)賽</b>冠亞軍,推動視頻畫質(zhì)升級

    傳音多媒體團隊CVPR NTIRE 2025兩項挑戰(zhàn)賽冠亞軍

    Efficient Super-Resolution Challenge)第一名,短視頻UGC圖像超分辨率挑戰(zhàn)賽(NTIRE 2025 Short-form UGC Image Super-Resolution
    的頭像 發(fā)表于 06-24 16:08 ?1330次閱讀
    傳音多媒體<b class='flag-5'>團隊</b>攬<b class='flag-5'>獲</b>CVPR NTIRE 2025兩項<b class='flag-5'>挑戰(zhàn)賽</b>冠亞軍

    華為榮登GlobalData運營商基礎(chǔ)設(shè)施管理服務(wù)排名報告Leader象限第一名

    象限第一名。 報告對通信服務(wù)商從商業(yè)模式、解決方案、網(wǎng)絡(luò)設(shè)計與優(yōu)化、網(wǎng)絡(luò)轉(zhuǎn)型能力、服務(wù)規(guī)模、和業(yè)務(wù)敏捷性六個維度進行了全面評估,華為綜合得分第一。這印證了華為在對全球運營商客戶提供領(lǐng)先服務(wù)解決方案、網(wǎng)絡(luò)極致性能和數(shù)智化轉(zhuǎn)型等方面做出了卓越
    的頭像 發(fā)表于 05-22 18:43 ?820次閱讀
    華為榮登GlobalData運營商基礎(chǔ)設(shè)施管理服務(wù)排名報告Leader象限<b class='flag-5'>第一名</b>

    實驗室安全管理成焦點,漢威科技賦能實驗室安全升級

    實驗室是國家科技創(chuàng)新體系的重要組成部分,是國家組織高水平基礎(chǔ)研究和應(yīng)用基礎(chǔ)研究、聚集和培養(yǎng)優(yōu)秀科學(xué)家、開展學(xué)術(shù)交流的重要基地。近年來,各高校、研究院所、科創(chuàng)園區(qū)、高新產(chǎn)業(yè)園區(qū)相關(guān)企業(yè)的實驗室呈現(xiàn)爆發(fā)
    的頭像 發(fā)表于 04-10 10:41 ?603次閱讀
    <b class='flag-5'>實驗室</b>安全管理成焦點,漢威科技賦能<b class='flag-5'>實驗室</b>安全升級

    微軟AI開發(fā)者挑戰(zhàn)賽即將開啟

    人工智能,正在重塑世界。2 月 5 日至 4 月 23 日,加入我們,共赴場聚焦 AI 技術(shù)的開發(fā)者挑戰(zhàn)賽!在這里,創(chuàng)意、技術(shù)和無限可能將碰撞出耀眼火花。無論你是開發(fā)新秀還是經(jīng)驗豐富的技術(shù)專家,這場由微軟 Azure 驅(qū)動的在
    的頭像 發(fā)表于 02-12 16:18 ?580次閱讀

    達實再度榮獲十大出入口控制品牌第一名

    近日,被譽為智能建筑行業(yè)“奧斯卡”的中國智能建筑品牌獎頒獎典禮于廣州盛大舉行。達實智能子公司——深圳達實物聯(lián)網(wǎng)技術(shù)有限公司 連續(xù)14年 “十大出入口控制品牌第一名”榮譽,與此同時還攬“2024年優(yōu)秀AIoT智控平臺品牌”等兩
    的頭像 發(fā)表于 12-11 10:23 ?997次閱讀

    蔚來獲得CACSI車型滿意度和售后服務(wù)滿意度第一名

    近日,由中國質(zhì)量協(xié)會發(fā)布的2024年中國新能源汽車用戶滿意度測評結(jié)果(CACSI)出爐。蔚來ET5T榮獲純電動中型轎車滿意度第一名,蔚來品牌榮獲售后服務(wù)滿意度第一名。蔚來已連續(xù)兩年獲得CACSI車型滿意度和售后服務(wù)滿意度第一名
    的頭像 發(fā)表于 12-06 17:19 ?2329次閱讀

    理想L6和理想L8榮獲中國新能源汽車用戶滿意度測評第一名

    近日,中國質(zhì)量協(xié)會發(fā)布2024年中國新能源汽車行業(yè)用戶滿意度測評(NEV-CACSI)結(jié)果,理想L62024年市場關(guān)注新車(SUV) 第一名,理想L8也成為混動中大型SUV第一名。雙雙登頂,證明著
    的頭像 發(fā)表于 12-05 14:00 ?1328次閱讀

    小米與聚飛光電成立聯(lián)合實驗室

    近日,“小米&聚飛聯(lián)合實驗室”在惠州聚飛正式揭牌成立。該實驗室將以Mini背光技術(shù)創(chuàng)新為主要方向,進步強化雙方在顯示終端領(lǐng)域的多元化合作。
    的頭像 發(fā)表于 11-27 10:45 ?867次閱讀