chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

人工智能如何拯救瀕危語(yǔ)言

NVIDIA英偉達(dá) ? 來源:cc ? 2019-01-29 15:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

據(jù)語(yǔ)言學(xué)家估計(jì),在全球化、文化同化等多種因素的影響下,到本世紀(jì)末,世界上約 7000 種的語(yǔ)言至少有一半將會(huì)消失。

記錄及振興瀕危語(yǔ)言的工作充滿挑戰(zhàn),其中部分原因在于缺乏相應(yīng)的文本和語(yǔ)音記錄。塞內(nèi)卡語(yǔ)是北美地區(qū)六個(gè)易洛魁聯(lián)盟所使用的語(yǔ)言之一,目前,僅有約 100 人將塞內(nèi)卡語(yǔ)作為第一語(yǔ)言,另有數(shù)百位非母語(yǔ)人士正在學(xué)習(xí)塞內(nèi)卡語(yǔ)。

自動(dòng)語(yǔ)音識(shí)別 (ASR) 技術(shù)已被廣泛應(yīng)用于轉(zhuǎn)寫英語(yǔ)和漢語(yǔ)等大語(yǔ)種,這些語(yǔ)言的使用人數(shù)高達(dá)數(shù)百萬至數(shù)十億。但對(duì)于塞內(nèi)卡語(yǔ)這類使用人數(shù)稀少且可用數(shù)據(jù)極度貧乏的語(yǔ)言來說,自動(dòng)語(yǔ)言識(shí)別技術(shù)發(fā)揮出的作用只是皮毛而已。

現(xiàn)在,紐約羅切斯特理工學(xué)院的一組研究人員以及布法羅大學(xué)的同事正在利用深度學(xué)習(xí)技術(shù)來增強(qiáng)自動(dòng)語(yǔ)音識(shí)別的功能。該項(xiàng)目現(xiàn)階段的工作核心是塞內(nèi)卡語(yǔ),但研究人員的愿景是將其應(yīng)用于全球各種瀕危語(yǔ)言的保護(hù),使之成為全人類共同文化歷史的重要組成部分。

“接觸不同的語(yǔ)言可以讓我們更多地了解大腦的運(yùn)作機(jī)制”,波士頓學(xué)院計(jì)算機(jī)科學(xué)助理教授兼羅切斯特理工學(xué)院研究員 Emily Prud'hommeaux 說道,“在記錄一種語(yǔ)言時(shí),保存下來的不僅是這種語(yǔ)言本身,還有人類使用語(yǔ)言的基本方式”。

Prud’hommeaux 及其同事選擇從塞內(nèi)卡語(yǔ)開始入手并非偶然。她表示,團(tuán)隊(duì)中有三名成員是塞內(nèi)卡人,在此類研究中,這種直接的聯(lián)系實(shí)屬罕見。

項(xiàng)目帶頭人是 Robbie Jimerson,他是羅切斯特理工學(xué)院 Golisano 計(jì)算與信息科學(xué)學(xué)院的博士研究生,也是塞內(nèi)卡印第安人部落中的一員,熱衷于保護(hù)塞內(nèi)卡語(yǔ)免于消亡。

“部落中的長(zhǎng)老為塞內(nèi)卡語(yǔ)的保護(hù)和推廣付出了很大的努力” ,Jimerson 說道,“我也在尋找機(jī)會(huì)貢獻(xiàn)自己的一份力量”。

利用生成對(duì)抗網(wǎng)絡(luò)創(chuàng)建更多語(yǔ)言樣本

目前,該項(xiàng)目已經(jīng)進(jìn)行到了第三個(gè)年頭,在積累語(yǔ)言數(shù)據(jù)時(shí),研究人員遇到了一些挑戰(zhàn)。Jimerson 說,塞內(nèi)卡群體在與外人分享東西時(shí)十分謹(jǐn)慎,所以塞內(nèi)卡語(yǔ)的錄音資料非常少。而他則迎難而上。

一開始,他把會(huì)說塞內(nèi)卡語(yǔ)的朋友和老人當(dāng)作錄音對(duì)象,并請(qǐng)求這些人錄下他們和各自朋友的談話錄音。每當(dāng)有人在公共場(chǎng)合說塞內(nèi)卡語(yǔ)時(shí),他都不會(huì)錯(cuò)過錄音的機(jī)會(huì)。此外,他還請(qǐng)家人錄下老人講述的古老傳說,同時(shí)也搜集了互聯(lián)網(wǎng)上一切可以公開獲取的視頻和錄音資料。

研究團(tuán)隊(duì)精心編寫了一款專門用來處理塞內(nèi)卡語(yǔ)的自動(dòng)語(yǔ)音識(shí)別模型,并通過生成對(duì)抗網(wǎng)絡(luò)利用有限的錄音創(chuàng)建出更多的語(yǔ)音樣本。該模型將錄音的波形文件轉(zhuǎn)換為字符流,同時(shí)計(jì)算出概率并進(jìn)行校正。

隨后,他們將得出的數(shù)據(jù)輸入深度學(xué)習(xí)模型,后者反過來增強(qiáng)了自動(dòng)語(yǔ)言識(shí)別模型的準(zhǔn)確度。

研究團(tuán)隊(duì)的網(wǎng)絡(luò)采用了兩種計(jì)算配置:其一是配備了九臺(tái)服務(wù)器的機(jī)器學(xué)習(xí)實(shí)驗(yàn)室,實(shí)驗(yàn)室中運(yùn)行著若干臺(tái) NVIDIA Tesla GPU;另一種是配備了大型服務(wù)器的大學(xué)集群,每臺(tái)服務(wù)器上運(yùn)行著 10 臺(tái)NVIDIA Tesla P4 GPU。每個(gè)集群都運(yùn)行著一系列深度學(xué)習(xí)框架,如 TensorFlow 和 Caffe。

“計(jì)算工程集群供計(jì)算機(jī)工程學(xué)院的所有學(xué)生使用,所以大家會(huì)‘爭(zhēng)搶’資源”,Ray Ptucha 如是說,他是羅切斯特理工學(xué)院計(jì)算機(jī)工程學(xué)院的助理教授,也是本項(xiàng)目的另一位成員。

有了這些彌足珍貴的集群,Jimerson 可以在運(yùn)行著NVIDIA TITAN X的本地機(jī)器上測(cè)試代碼并檢查模型的穩(wěn)定性,從而避免運(yùn)行可能會(huì)崩潰的模型,以至于為其他學(xué)生帶來不便。

準(zhǔn)確度更上一層樓

到目前為止,經(jīng)過團(tuán)隊(duì)的不懈努力,其自動(dòng)語(yǔ)音識(shí)別模型的文字錯(cuò)誤率已由 70% 降至 56%。Prud’hommeaux 稱,他們的目標(biāo)是將錯(cuò)誤率降低至 25%,這一水平相當(dāng)于幾年前使用自動(dòng)語(yǔ)音識(shí)別系統(tǒng)處理英語(yǔ)語(yǔ)音的水平。

團(tuán)隊(duì)可以積累的塞內(nèi)卡語(yǔ)語(yǔ)音和文字樣本越多,識(shí)別錯(cuò)誤率就會(huì)越低。(如今,英語(yǔ)自動(dòng)語(yǔ)音識(shí)別模型可以達(dá)到低至 5% 的錯(cuò)誤率。)

該團(tuán)隊(duì)取得的成果有望為全球其他語(yǔ)種的保護(hù)工作提供幫助。

據(jù) Prud’hommeaux 稱,團(tuán)隊(duì)已與一家存檔機(jī)構(gòu)達(dá)成協(xié)議,這是美國(guó)國(guó)家科學(xué)基金會(huì)為該項(xiàng)目提供的資助條件。當(dāng)他們開展記錄瀕危語(yǔ)言的其他工作時(shí),可使用最終形成的語(yǔ)言存檔數(shù)據(jù)庫(kù)作為可用資源。

與此同時(shí),Prud’hommeaux 還表示,團(tuán)隊(duì)的工作將為只能利用有限數(shù)據(jù)量的深度學(xué)習(xí)研究提供思路。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49028

    瀏覽量

    249539
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122795

原文標(biāo)題:人工智能幫助瀕危語(yǔ)言 “復(fù)活”

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習(xí)課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會(huì)發(fā)展的當(dāng)下,無論是探索未來職業(yè)方向,還是更新技術(shù)儲(chǔ)備,掌握大模型知識(shí)都已成為新時(shí)代的必修課。從職場(chǎng)上輔助工作的智能助手,到課堂用于學(xué)術(shù)研究的智能工具,大模型正在工作生活
    發(fā)表于 07-04 11:10

    我國(guó)生成式人工智能的發(fā)展現(xiàn)狀與趨勢(shì)

    作為信息化、數(shù)字化、智能化的新型技術(shù)基座,生成式人工智能對(duì)于提升國(guó)家戰(zhàn)略地位與國(guó)際競(jìng)爭(zhēng)力具有重要意義。2022年11月以來,隨著以ChatGPT為代表的大語(yǔ)言模型迅速發(fā)展,生成式人工智能
    的頭像 發(fā)表于 02-08 11:31 ?1489次閱讀

    人工智能推理及神經(jīng)處理的未來

    人工智能行業(yè)所圍繞的是一個(gè)受技術(shù)進(jìn)步、社會(huì)需求和監(jiān)管政策影響的動(dòng)態(tài)環(huán)境。機(jī)器學(xué)習(xí)、自然語(yǔ)言處理和計(jì)算機(jī)視覺方面的技術(shù)進(jìn)步,加速了人工智能的發(fā)展和應(yīng)用。包括醫(yī)療保健、金融和制造業(yè)在內(nèi)的各個(gè)行業(yè)對(duì)自動(dòng)化
    的頭像 發(fā)表于 12-23 11:18 ?596次閱讀
    <b class='flag-5'>人工智能</b>推理及神經(jīng)處理的未來

    編程語(yǔ)言人工智能中的使用

    。編程語(yǔ)言在AI的發(fā)展中扮演著至關(guān)重要的角色,它們?yōu)殚_發(fā)人員提供了構(gòu)建和實(shí)現(xiàn)智能系統(tǒng)的工具和框架。 1. Python Python是人工智能領(lǐng)域最受歡迎的編程語(yǔ)言之一,原因有以下幾點(diǎn)
    的頭像 發(fā)表于 11-15 09:34 ?985次閱讀

    嵌入式和人工智能究竟是什么關(guān)系?

    、連接主義和深度學(xué)習(xí)等不同的階段。目前,人工智能已經(jīng)廣泛應(yīng)用于各種領(lǐng)域,如自然語(yǔ)言處理、計(jì)算機(jī)視覺、智能推薦等。 嵌入式系統(tǒng)和人工智能在許多方面都存在密切的關(guān)聯(lián)性。首先,嵌入式系統(tǒng)可
    發(fā)表于 11-14 16:39

    LLM技術(shù)對(duì)人工智能發(fā)展的影響

    隨著人工智能技術(shù)的飛速發(fā)展,大型語(yǔ)言模型(LLM)技術(shù)已經(jīng)成為推動(dòng)AI領(lǐng)域進(jìn)步的關(guān)鍵力量。LLM技術(shù)通過深度學(xué)習(xí)和自然語(yǔ)言處理技術(shù),使得機(jī)器能夠理解和生成自然語(yǔ)言,極大地?cái)U(kuò)展了
    的頭像 發(fā)表于 11-08 09:28 ?1855次閱讀

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

    探討了人工智能如何通過技術(shù)創(chuàng)新推動(dòng)能源科學(xué)的進(jìn)步,為未來的可持續(xù)發(fā)展提供了強(qiáng)大的支持。 首先,書中通過深入淺出的語(yǔ)言,介紹了人工智能在能源領(lǐng)域的基本概念和技術(shù)原理。這使得我對(duì)人工智能
    發(fā)表于 10-14 09:27

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    很幸運(yùn)社區(qū)給我一個(gè)閱讀此書的機(jī)會(huì),感謝平臺(tái)。 《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章關(guān)于AI與生命科學(xué)的部分,為我們揭示了人工智能技術(shù)在生命科學(xué)領(lǐng)域中的廣泛應(yīng)用和深遠(yuǎn)影響。在
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

    周末收到一本新書,非常高興,也非常感謝平臺(tái)提供閱讀機(jī)會(huì)。 這是一本挺好的書,包裝精美,內(nèi)容詳實(shí),干活滿滿。 《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》這本書的第一章,作為整個(gè)著作的開篇
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應(yīng)用前景分析

    RISC-V在人工智能圖像處理領(lǐng)域的應(yīng)用前景十分廣闊,這主要得益于其開源性、靈活性和低功耗等特點(diǎn)。以下是對(duì)RISC-V在人工智能圖像處理應(yīng)用前景的詳細(xì)分析: 一、RISC-V的基本特點(diǎn) RISC-V
    發(fā)表于 09-28 11:00

    人工智能ai 數(shù)電 模電 模擬集成電路原理 電路分析

    人工智能ai 數(shù)電 模電 模擬集成電路原理 電路分析 想問下哪些比較容易學(xué) 不過好像都是要學(xué)的
    發(fā)表于 09-26 15:24

    人工智能ai4s試讀申請(qǐng)

    目前人工智能在繪畫對(duì)話等大模型領(lǐng)域應(yīng)用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個(gè)需要研究的課題,本書對(duì)ai4s基本原理和原則,方法進(jìn)行描訴,有利于總結(jié)經(jīng)驗(yàn),擬按照要求準(zhǔn)備相關(guān)體會(huì)材料??茨芊裼兄谌腴T和提高ss
    發(fā)表于 09-09 15:36

    名單公布!【書籍評(píng)測(cè)活動(dòng)NO.44】AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新

    活的世界? 編輯推薦 《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》聚焦于人工智能與材料科學(xué)、生命科學(xué)、電子科學(xué)、能源科學(xué)、環(huán)境科學(xué)五大領(lǐng)域的交叉融合,通過深入淺出的語(yǔ)言和諸多實(shí)際應(yīng)用案例,介紹了
    發(fā)表于 09-09 13:54

    報(bào)名開啟!深圳(國(guó)際)通用人工智能大會(huì)將啟幕,國(guó)內(nèi)外大咖齊聚話AI

    8月28日至30日,2024深圳(國(guó)際)通用人工智能大會(huì)暨深圳(國(guó)際)通用人工智能產(chǎn)業(yè)博覽會(huì)將在深圳國(guó)際會(huì)展中心(寶安)舉辦。大會(huì)以“魅力AI·無限未來”為主題,致力于打造全球通用人工智能領(lǐng)域集產(chǎn)品
    發(fā)表于 08-22 15:00

    FPGA在人工智能中的應(yīng)用有哪些?

    FPGA(現(xiàn)場(chǎng)可編程門陣列)在人工智能領(lǐng)域的應(yīng)用非常廣泛,主要體現(xiàn)在以下幾個(gè)方面: 一、深度學(xué)習(xí)加速 訓(xùn)練和推理過程加速:FPGA可以用來加速深度學(xué)習(xí)的訓(xùn)練和推理過程。由于其高并行性和低延遲特性
    發(fā)表于 07-29 17:05