chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

人工智能如何拯救瀕危語言

NVIDIA英偉達(dá) ? 來源:cc ? 2019-01-29 15:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

據(jù)語言學(xué)家估計,在全球化、文化同化等多種因素的影響下,到本世紀(jì)末,世界上約 7000 種的語言至少有一半將會消失。

記錄及振興瀕危語言的工作充滿挑戰(zhàn),其中部分原因在于缺乏相應(yīng)的文本和語音記錄。塞內(nèi)卡語是北美地區(qū)六個易洛魁聯(lián)盟所使用的語言之一,目前,僅有約 100 人將塞內(nèi)卡語作為第一語言,另有數(shù)百位非母語人士正在學(xué)習(xí)塞內(nèi)卡語。

自動語音識別 (ASR) 技術(shù)已被廣泛應(yīng)用于轉(zhuǎn)寫英語和漢語等大語種,這些語言的使用人數(shù)高達(dá)數(shù)百萬至數(shù)十億。但對于塞內(nèi)卡語這類使用人數(shù)稀少且可用數(shù)據(jù)極度貧乏的語言來說,自動語言識別技術(shù)發(fā)揮出的作用只是皮毛而已。

現(xiàn)在,紐約羅切斯特理工學(xué)院的一組研究人員以及布法羅大學(xué)的同事正在利用深度學(xué)習(xí)技術(shù)來增強(qiáng)自動語音識別的功能。該項目現(xiàn)階段的工作核心是塞內(nèi)卡語,但研究人員的愿景是將其應(yīng)用于全球各種瀕危語言的保護(hù),使之成為全人類共同文化歷史的重要組成部分。

“接觸不同的語言可以讓我們更多地了解大腦的運(yùn)作機(jī)制”,波士頓學(xué)院計算機(jī)科學(xué)助理教授兼羅切斯特理工學(xué)院研究員 Emily Prud'hommeaux 說道,“在記錄一種語言時,保存下來的不僅是這種語言本身,還有人類使用語言的基本方式”。

Prud’hommeaux 及其同事選擇從塞內(nèi)卡語開始入手并非偶然。她表示,團(tuán)隊中有三名成員是塞內(nèi)卡人,在此類研究中,這種直接的聯(lián)系實(shí)屬罕見。

項目帶頭人是 Robbie Jimerson,他是羅切斯特理工學(xué)院 Golisano 計算與信息科學(xué)學(xué)院的博士研究生,也是塞內(nèi)卡印第安人部落中的一員,熱衷于保護(hù)塞內(nèi)卡語免于消亡。

“部落中的長老為塞內(nèi)卡語的保護(hù)和推廣付出了很大的努力” ,Jimerson 說道,“我也在尋找機(jī)會貢獻(xiàn)自己的一份力量”。

利用生成對抗網(wǎng)絡(luò)創(chuàng)建更多語言樣本

目前,該項目已經(jīng)進(jìn)行到了第三個年頭,在積累語言數(shù)據(jù)時,研究人員遇到了一些挑戰(zhàn)。Jimerson 說,塞內(nèi)卡群體在與外人分享東西時十分謹(jǐn)慎,所以塞內(nèi)卡語的錄音資料非常少。而他則迎難而上。

一開始,他把會說塞內(nèi)卡語的朋友和老人當(dāng)作錄音對象,并請求這些人錄下他們和各自朋友的談話錄音。每當(dāng)有人在公共場合說塞內(nèi)卡語時,他都不會錯過錄音的機(jī)會。此外,他還請家人錄下老人講述的古老傳說,同時也搜集了互聯(lián)網(wǎng)上一切可以公開獲取的視頻和錄音資料。

研究團(tuán)隊精心編寫了一款專門用來處理塞內(nèi)卡語的自動語音識別模型,并通過生成對抗網(wǎng)絡(luò)利用有限的錄音創(chuàng)建出更多的語音樣本。該模型將錄音的波形文件轉(zhuǎn)換為字符流,同時計算出概率并進(jìn)行校正。

隨后,他們將得出的數(shù)據(jù)輸入深度學(xué)習(xí)模型,后者反過來增強(qiáng)了自動語言識別模型的準(zhǔn)確度。

研究團(tuán)隊的網(wǎng)絡(luò)采用了兩種計算配置:其一是配備了九臺服務(wù)器的機(jī)器學(xué)習(xí)實(shí)驗(yàn)室,實(shí)驗(yàn)室中運(yùn)行著若干臺 NVIDIA Tesla GPU;另一種是配備了大型服務(wù)器的大學(xué)集群,每臺服務(wù)器上運(yùn)行著 10 臺NVIDIA Tesla P4 GPU。每個集群都運(yùn)行著一系列深度學(xué)習(xí)框架,如 TensorFlow 和 Caffe。

“計算工程集群供計算機(jī)工程學(xué)院的所有學(xué)生使用,所以大家會‘爭搶’資源”,Ray Ptucha 如是說,他是羅切斯特理工學(xué)院計算機(jī)工程學(xué)院的助理教授,也是本項目的另一位成員。

有了這些彌足珍貴的集群,Jimerson 可以在運(yùn)行著NVIDIA TITAN X的本地機(jī)器上測試代碼并檢查模型的穩(wěn)定性,從而避免運(yùn)行可能會崩潰的模型,以至于為其他學(xué)生帶來不便。

準(zhǔn)確度更上一層樓

到目前為止,經(jīng)過團(tuán)隊的不懈努力,其自動語音識別模型的文字錯誤率已由 70% 降至 56%。Prud’hommeaux 稱,他們的目標(biāo)是將錯誤率降低至 25%,這一水平相當(dāng)于幾年前使用自動語音識別系統(tǒng)處理英語語音的水平。

團(tuán)隊可以積累的塞內(nèi)卡語語音和文字樣本越多,識別錯誤率就會越低。(如今,英語自動語音識別模型可以達(dá)到低至 5% 的錯誤率。)

該團(tuán)隊取得的成果有望為全球其他語種的保護(hù)工作提供幫助。

據(jù) Prud’hommeaux 稱,團(tuán)隊已與一家存檔機(jī)構(gòu)達(dá)成協(xié)議,這是美國國家科學(xué)基金會為該項目提供的資助條件。當(dāng)他們開展記錄瀕危語言的其他工作時,可使用最終形成的語言存檔數(shù)據(jù)庫作為可用資源。

與此同時,Prud’hommeaux 還表示,團(tuán)隊的工作將為只能利用有限數(shù)據(jù)量的深度學(xué)習(xí)研究提供思路。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1813

    文章

    49774

    瀏覽量

    261795
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5591

    瀏覽量

    123939

原文標(biāo)題:人工智能幫助瀕危語言 “復(fù)活”

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    航天宏圖人工智能技術(shù)深度賦能社會治理現(xiàn)代化

    航天宏圖多年來持續(xù)重點(diǎn)投入技術(shù)研發(fā),尤其專注人工智能深度探索。航天宏圖多以自主研發(fā)“天權(quán)大模型” 是一款基于多模態(tài)大模型技術(shù)的遙感解譯專用AI大模型,它以人工智能為底座,提供遙感影像智能解譯、自然
    的頭像 發(fā)表于 09-06 10:35 ?878次閱讀
    航天宏圖<b class='flag-5'>人工智能</b>技術(shù)深度賦能社會治理現(xiàn)代化

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    的框架小 10 倍,速度也快 10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文中,我們將介紹這對開發(fā)人員意味著什么,以及使用 Neuton 模型如何改進(jìn)您的開發(fā)和終端
    發(fā)表于 08-31 20:54

    人工智能+”,走老路難賺到新錢

    昨天的“人工智能+”刷屏了,這算是官方第一次對“人工智能+”這個名稱定性吧?今年年初到現(xiàn)在,涌現(xiàn)出了一大批基于人工智能的創(chuàng)業(yè)者,這已經(jīng)算是AI2.0時代的第三波創(chuàng)業(yè)潮了,第一波是基礎(chǔ)大模型,第二波
    的頭像 發(fā)表于 08-27 13:21 ?544次閱讀
    “<b class='flag-5'>人工智能</b>+”,走老路難賺到新錢

    挖到寶了!人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器

    家人們,最近在研究人工智能相關(guān)設(shè)備,挖到了一款超厲害的寶藏——比鄰星人工智能綜合實(shí)驗(yàn)箱,必須來給大伙分享分享!可?(壹捌伍 柒零零玖 壹壹捌陸) 一、開箱即學(xué),便捷拉滿 這個實(shí)驗(yàn)箱真的是為使用者
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器!

    家人們,最近在研究人工智能相關(guān)設(shè)備,挖到了一款超厲害的寶藏——比鄰星人工智能綜合實(shí)驗(yàn)箱,必須來給大伙分享分享!可?(壹捌伍 柒零零玖 壹壹捌陸) 一、開箱即學(xué),便捷拉滿 這個實(shí)驗(yàn)箱真的是為使用者
    發(fā)表于 08-07 14:23

    超小型Neuton機(jī)器學(xué)習(xí)模型, 在任何系統(tǒng)級芯片(SoC)上解鎖邊緣人工智能應(yīng)用.

    Neuton 是一家邊緣AI 公司,致力于讓機(jī)器 學(xué)習(xí)模型更易于使用。它創(chuàng)建的模型比競爭對手的框架小10 倍,速度也快10 倍,甚至可以在最先進(jìn)的邊緣設(shè)備上進(jìn)行人工智能處理。在這篇博文中,我們將介紹
    發(fā)表于 07-31 11:38

    人工智能技術(shù)的現(xiàn)狀與未來發(fā)展趨勢

    人工智能技術(shù)的現(xiàn)狀與未來發(fā)展趨勢 ? ? 近年來,人工智能(AI)技術(shù)迅猛發(fā)展,深刻影響著各行各業(yè)。從計算機(jī)視覺到自然語言處理,從自動駕駛到醫(yī)療診斷,AI的應(yīng)用場景不斷擴(kuò)展,推動社會向智能
    的頭像 發(fā)表于 07-16 15:01 ?1246次閱讀

    迅為RK3588開發(fā)板Linux安卓麒麟瑞芯微國產(chǎn)工業(yè)AI人工智能

    迅為RK3588開發(fā)板Linux安卓麒麟瑞芯微國產(chǎn)工業(yè)AI人工智能
    發(fā)表于 07-14 11:23

    最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習(xí)課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會發(fā)展的當(dāng)下,無論是探索未來職業(yè)方向,還是更新技術(shù)儲備,掌握大模型知識都已成為新時代的必修課。從職場上輔助工作的智能助手,到課堂用于學(xué)術(shù)研究的智能工具,大模型正在工作生活
    發(fā)表于 07-04 11:10

    維智科技為什么提出時空人工智能

    在AI技術(shù)突飛猛進(jìn)的今天,語言、圖像和語音的智能能力不斷突破,但一個更本質(zhì)的問題逐漸顯現(xiàn):人工智能真的理解我們所處的空間世界嗎?從智能城市到商業(yè)選址,從應(yīng)急調(diào)度到人機(jī)交互,AI正走向“
    的頭像 發(fā)表于 06-12 14:30 ?762次閱讀

    開售RK3576 高性能人工智能主板

    ,HDMI-4K 輸出,支 持千兆以太網(wǎng),WiFi,USB 擴(kuò)展/重力感應(yīng)/RS232/RS485/IO 擴(kuò)展/I2C 擴(kuò)展/MIPI 攝像頭/紅外遙控 器等功能,豐富的接口,一個全新八核擁有超強(qiáng)性能的人工智能
    發(fā)表于 04-23 10:55

    Cognizant將與NVIDIA合作部署神經(jīng)人工智能平臺,加速企業(yè)人工智能應(yīng)用

    -Cognizant將與NVIDIA合作部署神經(jīng)人工智能平臺,加速企業(yè)人工智能應(yīng)用 Cognizant將在關(guān)鍵增長領(lǐng)域提供解決方案,包括企業(yè)級AI智能體、定制化行業(yè)大型語言模型及搭載N
    的頭像 發(fā)表于 03-26 14:42 ?587次閱讀
    Cognizant將與NVIDIA合作部署神經(jīng)<b class='flag-5'>人工智能</b>平臺,加速企業(yè)<b class='flag-5'>人工智能</b>應(yīng)用

    我國生成式人工智能的發(fā)展現(xiàn)狀與趨勢

    作為信息化、數(shù)字化、智能化的新型技術(shù)基座,生成式人工智能對于提升國家戰(zhàn)略地位與國際競爭力具有重要意義。2022年11月以來,隨著以ChatGPT為代表的大語言模型迅速發(fā)展,生成式人工智能
    的頭像 發(fā)表于 02-08 11:31 ?2166次閱讀

    DeepSeek對人工智能領(lǐng)域的啟示

    本文作者是 IBM 董事長兼首席執(zhí)行官 Arvind Krishna。他認(rèn)為,社會各界不應(yīng)止步于應(yīng)用人工智能,更要成為人工智能的共建者。
    的頭像 發(fā)表于 02-07 09:46 ?1455次閱讀

    人工智能推理及神經(jīng)處理的未來

    人工智能行業(yè)所圍繞的是一個受技術(shù)進(jìn)步、社會需求和監(jiān)管政策影響的動態(tài)環(huán)境。機(jī)器學(xué)習(xí)、自然語言處理和計算機(jī)視覺方面的技術(shù)進(jìn)步,加速了人工智能的發(fā)展和應(yīng)用。包括醫(yī)療保健、金融和制造業(yè)在內(nèi)的各個行業(yè)對自動化
    的頭像 發(fā)表于 12-23 11:18 ?880次閱讀
    <b class='flag-5'>人工智能</b>推理及神經(jīng)處理的未來