chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

科大訊飛語音翻譯新技術路線上再獲突破

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-11-05 17:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

科大訊飛日前在全球最具影響力的口語機器翻譯評測比賽IWSLT中,獲得了語音翻譯端到端模型評測的冠軍,還成為英德口語翻譯任務中唯一受邀做Oral report的參賽團隊。端到端技術是當前語音翻譯的研究前沿,科大訊飛聯(lián)合優(yōu)化語音識別和機器翻譯的新技術路線,理論上更具前景,一旦技術研究成功,將為翻譯機器性能的提升帶來極大促進。

提問:語音翻譯涉及哪些步驟?

你或許會說,語音識別和機器翻譯——沒錯,傳統(tǒng)的語音翻譯通常采用語音識別和機器翻譯級聯(lián)的方式實現(xiàn),對輸入語音先進行語音識別得到文本結果,然后再基于文本進行機器翻譯,這也是當前語音翻譯采用的主流方法。

不過,由于口語句子中含有大量非規(guī)范語言現(xiàn)象,例如重復、省略、顛倒,以及語義邏輯不清,斷句困難等問題,導致后續(xù)機器翻譯帶來嚴重的挑戰(zhàn)。此外,復雜環(huán)境下語音識別受發(fā)音人口音、環(huán)境噪聲,以及和語言中存在的同音詞、易混淆詞等復雜音素的影響也存在著識別錯誤,對最終機器翻譯性能也可能帶來影響。

因此,實際應用系統(tǒng)中,通常會在語音識別和機器翻譯之間增加一個語音識別后處理模塊,通過對識別結果進行規(guī)整、斷句、順滑、標點預測,甚至糾錯來盡可能地減小口語化和識別錯誤的影響。

不過,受語音和語言復雜性的影響,截止到目前為止,這些問題并沒有被真正解決。

在剛剛結束的2018年國際口語機器翻譯評測比賽(International Workshop on Spoken Language Translation,IWSLT)中,科大訊飛團隊在端到端模型(End-to-End Model)的評測比賽中,以顯著優(yōu)勢奪得第一名。該獎項也是科大訊飛今年在各項國際競賽中的第9個“世界冠軍”。

端到端語音翻譯技術路線,是通過構造一個完整的神經(jīng)網(wǎng)絡模型,聯(lián)合優(yōu)化語音識別、識別后處理和機器翻譯,建立源語言語音信號到目標語言文字的映射關系,進而實現(xiàn)從原始語音到目標譯文的翻譯。

這提供了一種解決語音翻譯的新思路,而且從目前看是初步可行的。一旦技術研究成功,理論上可以讓語音翻譯更準更快,未來也將為翻譯機器性能的提升帶來極大促進。

國際頂級口語機器翻譯評測比賽 IWSLT,推動語音翻譯新方向

IWSLT是國際上最具影響力的口語機器翻譯評測比賽之一,重點關注口語,實現(xiàn)語音到文本的翻譯,從而解決人和人交流的問題。

到目前為止,IWSLT已經(jīng)舉辦了15屆,吸引了全球70多家科研團隊的參與。IWSLT針對語音翻譯實際應用面臨的難題,通過每年設定一些研究任務,并向外界提供公開的數(shù)據(jù)集合和評測交流機會,吸引了來自全球的科研團隊參與,對于推動語音翻譯技術創(chuàng)新和知識共享具有重要的意義。

除了科大訊飛,IWSLT 2018吸引了世界各地多所機器翻譯領域的知名大學及研究所參加,包括英國愛丁堡大學(University of Edinburgh)、美國約翰霍普金斯大學(JHU)、德國卡爾斯魯厄理工學院(KIT)、意大利Bruno Kessler 基金會(FBK)、芬蘭赫爾辛基大學(Helsinki),以及國內的阿里巴巴、搜狗等。

本次比賽包括兩個主要任務,一是英語到德語演講場景下的語音翻譯任務;二是巴斯克語到英語的低資源文本翻譯任務。

其中,在英語到德語的語音翻譯任務上,主辦方在今年提出了兩種評測方案:

傳統(tǒng)路線,也即語音識別、識別后處理、機器翻譯分而治之,稱之為基線模型(baseline Model);

端到端模型(End-to-end Model),將語音識別、識別后處理和機器翻譯統(tǒng)一起來聯(lián)合優(yōu)化,能夠在一定程度上避免傳統(tǒng)基線模型中存在的識別錯誤擴散等問題,是一種新的思路,理論上更具前景。

端到端模型是當前口語翻譯研究領域的前沿,隨著深度學習的進步,研究人員開始探索通過構造一個完整的神經(jīng)網(wǎng)絡模型,建立語音信號到目標文字的映射關系。

該方法通過將語音識別、識別后處理和機器翻譯統(tǒng)一起來聯(lián)合優(yōu)化,為解決傳統(tǒng)級聯(lián)方案分而治之中存在的難題提供了一種新的思路。例如,2017年Interspeech會議上,谷歌研究人員就將該方法應用到西班牙到英語的語音翻譯任務上,取得初步成效。

引入這一新的評測方案,也體現(xiàn)了IWSLT主辦方引導科研探索,推動語音翻譯技術不斷進步的努力。

科大訊飛勇于挑戰(zhàn)新路線,端到端語音翻譯獲得第一

科大訊飛參與了口語翻譯的兩種評測,并且是唯一參與端到端模型這種新技術路線的中國團隊。不僅如此,科大訊飛還作為唯一受組委會邀請的語音翻譯任務參賽團隊、進行Oral report,向與會人員分享兩種技術路線研究所采用的方法,對促進語音翻譯新技術的進步具有重要作用。

因為語言和語音本身的復雜性,新技術路線對統(tǒng)一建模需要很強的語音處理能力和調序能力,加之語言本身受到口語表達、環(huán)境噪聲的干擾,所以端到端技術路線要實現(xiàn)從原始語音到目標文本的翻譯,就是難上加難。

值得一提,賽事提供的公開數(shù)據(jù)集合中,能夠為端到端模型方法提供直接的有監(jiān)督數(shù)據(jù)是小規(guī)模的。要在3個月的時間里,在小規(guī)模數(shù)據(jù)上構建一套高性能的端到端語音翻譯系統(tǒng),非常具有挑戰(zhàn)性。

基于語音和機器翻譯上雄厚的技術積累,訊飛研究團隊針對端到端語音翻譯任務開展了探索性研究,最終在英德語音翻譯任務的端到端模型評測方案上獲得了第一名(與第二名BLEU分數(shù)拉開9個百分點,一般而言,提升3個百分點就能明顯體會到系統(tǒng)的優(yōu)劣差異)。

不僅如此,在基線模型評測中,科大訊飛也取得了第二名的好成績。

“比賽的成績只是一方面,我們看重的是在源頭技術、新技術上進行探索,”科大訊飛的研究人員表示。

“我們參加了本次IWSLT評測的語音翻譯任務,在基于傳統(tǒng)的基線模型中,針對語音識別文本結果和機器翻譯訓練數(shù)據(jù)源語言文本風格不匹配問題,提出了對源語言文本逆變換以適配識別風格的方法,提高了語音翻譯的魯棒性。在端到端模型中,提出了基于DenseNet和BiLSTM編碼,以及基于自注意力機制解碼的端到端建模方案。實驗結果表明,盡管當前端到端模型的效果低于傳統(tǒng)方法,但從結果來看也證明該方法具有一定的可行性,整體系統(tǒng)框架也更加簡潔優(yōu)雅,有望為語音翻譯提供一種新的解決思路?!?/p>

客觀評價語音翻譯端到端技術,數(shù)據(jù)將是一大瓶頸和障礙,因為語音識別的數(shù)據(jù)已積累了上十萬小時、機器翻譯的數(shù)據(jù)搜集也達到千萬甚至上億,但端到端的模型,需要專門的語音到文本的句對,這方面的數(shù)據(jù)目前積累不夠,若要商業(yè)化,還需要更大的數(shù)據(jù)支撐。

對此,科大訊飛研究團隊表示,“由于語音翻譯任務的復雜性以及訓練數(shù)據(jù)搜集的困難,無論傳統(tǒng)的基線模型方案還是最新提出的端到端語音翻譯方案,在實際應用中都還面臨一系列的難題,需要學術界和產(chǎn)業(yè)界共同努力?!?/p>

至于端到端的新技術,“如果能減少對有監(jiān)督語音翻譯平行數(shù)據(jù)的依賴那是最好不過,而且這存在一定的可能性,例如可以嘗試借用現(xiàn)有的語音識別訓練數(shù)據(jù)和機器翻譯訓練數(shù)據(jù),我們正在努力探索?!?/p>

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 語音識別
    +關注

    關注

    39

    文章

    1802

    瀏覽量

    115526
  • 機器翻譯
    +關注

    關注

    0

    文章

    141

    瀏覽量

    15466
  • 科大訊飛
    +關注

    關注

    19

    文章

    852

    瀏覽量

    63181

原文標題:語音翻譯也能端到端?深度學習這條路有戲!

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    科大飛發(fā)布飛星火X1.5及系列AI產(chǎn)品

    11月6日,第八屆世界聲博會暨2025科大飛全球1024開發(fā)者節(jié)發(fā)布會上,科大飛以《更懂你的AI》為主題發(fā)布飛星火大模型最
    的頭像 發(fā)表于 11-10 11:49 ?577次閱讀

    科大飛上半年虧損2.39億元,AI學習機、翻譯機、錄音筆銷量可觀

    研發(fā)投入23.92億元,占營業(yè)收入的比例達21.92%。 ? 與此同時,面向消費者的業(yè)務(TOC業(yè)務)繼續(xù)保持快速增長,其中科大飛AI學習機表現(xiàn)尤為突出,上半年收入實現(xiàn)翻番增長。 科大
    的頭像 發(fā)表于 08-24 07:45 ?6592次閱讀
    <b class='flag-5'>科大</b><b class='flag-5'>訊</b>飛上半年虧損2.39億元,AI學習機、<b class='flag-5'>翻譯</b>機、錄音筆銷量可觀

    科大飛上半年虧損2.39億元,AI學習機、翻譯機、錄音筆銷量可觀

    上半年研發(fā)投入23.92億元,占營業(yè)收入的比例達21.92%。 與此同時,面向消費者的業(yè)務(TOC業(yè)務)繼續(xù)保持快速增長,其中科大飛AI學習機表現(xiàn)尤為突出,上半年收入實現(xiàn)翻番增長。 科大
    發(fā)表于 08-24 01:12 ?1658次閱讀

    打破交互困局:科大飛這樣出手

    十年深耕,科大飛智能交互如何引領未來
    的頭像 發(fā)表于 06-17 11:50 ?855次閱讀
    打破交互困局:<b class='flag-5'>科大</b><b class='flag-5'>訊</b>飛這樣出手

    回顧科大飛26周年慶精彩瞬間

    近日,科大飛26周年司慶上,董事長劉慶峰對這個作文題感觸很深:“從1999年創(chuàng)業(yè)時在“中國被人扼住了咽喉”背景下以語音合成系統(tǒng)破局,到這些年智能語音、機器
    的頭像 發(fā)表于 06-13 14:08 ?758次閱讀

    科大飛加速東南亞企業(yè)的人工智能應用

    日前,科大飛在新加坡成功舉辦合作伙伴峰會暨創(chuàng)新產(chǎn)品發(fā)布會。這場匯聚關鍵合作伙伴、行業(yè)先驅和技術領袖的盛會,不僅集中展示了科大飛最新AI創(chuàng)
    的頭像 發(fā)表于 05-06 09:39 ?681次閱讀

    科大飛亮相第137屆廣交會

    今天,第137屆中國進出口商品交易會(廣交會)在廣州開幕。科大飛又一年參展,集中展示了飛星火大模型的最新技術成果以及在辦公、教育、汽車、工業(yè)等領域的產(chǎn)品和應用。
    的頭像 發(fā)表于 04-17 09:30 ?936次閱讀

    北汽集團與科大飛達成戰(zhàn)略合作

    近日,科大飛董事長劉慶峰一行到訪北汽集團,與北汽集團黨委書記、董事長張建勇進行座談交流,北汽集團與科大飛簽署戰(zhàn)略合作框架協(xié)議,雙方將共同推動汽車智能化領域的全方位戰(zhàn)略合作,依托先進
    的頭像 發(fā)表于 03-04 10:28 ?700次閱讀

    科大飛Air 2電紙書和掌閱Ocean4 Plus區(qū)別

    ComfortLight Pro光源技術,支持30級亮度和色溫調節(jié),夜間閱讀時眼睛也不會感到不適。 科大飛 Air 2 更多使用感受和評價https://u.jd.com/GGAOnEY 在性能方面
    發(fā)表于 03-03 14:01

    科大飛發(fā)布飛星火X1深度推理大模型

    近日,科大飛宣布了一項重大突破,成功推出了當前全國產(chǎn)算力平臺上唯一的深度推理大模型——飛星火X1。這款大模型在中文數(shù)學能力方面位居國內首位,并已在教育、醫(yī)療等剛需場景中率先實現(xiàn)應用
    的頭像 發(fā)表于 01-16 10:46 ?1052次閱讀

    科大飛發(fā)布星火深度推理模型X1,技術升級引領行業(yè)創(chuàng)新

    近日,科大飛在人工智能技術領域再次取得重大突破,正式發(fā)布星火深度推理模型X1。這一創(chuàng)新成果的發(fā)布,標志著科大
    的頭像 發(fā)表于 01-15 16:43 ?911次閱讀

    科大飛發(fā)布星火深度推理模型X1

    今天,科大飛正式發(fā)布星火深度推理模型X1,星火4.0 Turbo底座全面升級,首發(fā)星火語音同傳大模型。
    的頭像 發(fā)表于 01-15 15:54 ?1026次閱讀

    科大飛即將發(fā)布飛星火深度推理模型X1

    ,標志著科大飛在AI技術領域的又一次重大突破。飛星火深度推理模型X1將為科大
    的頭像 發(fā)表于 01-08 10:30 ?1016次閱讀

    科大飛升級多款辦公智能體

    近日,科大飛辦公智能體產(chǎn)品升級發(fā)布會,在北京中關村國際會議中心如期舉辦。
    的頭像 發(fā)表于 01-08 10:05 ?1584次閱讀

    科大飛為華為Mate70提供技術支持

    簽約標志著雙方將在技術創(chuàng)新、產(chǎn)業(yè)應用以及商業(yè)合作等多個領域展開全方位、深層次的合作,共同致力于構建更加完善的人工智能產(chǎn)業(yè)生態(tài)。 值得一提的是,在華為最新發(fā)布的Mate70智能手機中,科大飛為其提供了關鍵的
    的頭像 發(fā)表于 12-19 11:03 ?4236次閱讀