chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

無法被AI識別翻譯的古老語言,將去何方?

如意 ? 來源:OFweek電子工程網(wǎng) ? 作者:學術頭條 ? 2020-10-26 11:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

語言是文化的有機組成部分,也是文化的載體,世界文明的多樣性在很大程度上表現(xiàn)為世界語言的多樣性。而在 21 世紀的今天,語言學家們顯然已經(jīng)不滿足于傳統(tǒng)的、對已知語言的研究。相反,許多科學家開始利用計算機技術,去探索已經(jīng)消失的、幾乎成為謎底的滅絕古老語言。

近日,麻省理工學院計算機科學與人工智能實驗室(Computer Science and Artificial Intelligence Laboratory 簡稱 CSAIL)的研究人員就開發(fā)出一種計算機算法,旨在幫助語言學家破譯歷史上已消失的語言。

無法“谷歌翻譯”的古老語言

如今,世界上現(xiàn)存約有 7100 種語言。然而,古時存在的大多數(shù)語言都已不再使用,幾近滅絕。數(shù)十種已滅絕語言也被認為是“未破譯”的語言,也就是說,我們對它們的語法(grammar)、詞匯(vocabulary)或句法(syntax)了解不足,也無法理解其文本的意思。

圖 | 世界語言分布地圖 2018

而研究這些“未破譯”的語言,不僅僅是處于學術上的好奇心。還是因為,不理解語言,我們就會錯過與講這些語言的人有關的一整套知識體系。不幸的是,大多數(shù)滅絕語言的相關記錄極少,因此,科學家無法使用谷歌翻譯之類的機器翻譯工具或AI算法來對其進行解密。

而傳統(tǒng)的研究方法是,找出目標語言的“相關”語言來作比較研究,例如同一語系或相似度較高的現(xiàn)存語言。然而,有些語言并沒有對應的、已被深入研究過的“相關”語言,并且它們通常缺少諸如空格和標點符號之類的傳統(tǒng)分隔符(想像一下,要解密出用這種語言寫出的文字該有多么令人頭禿)。

但是,CSAIL 的研究人員發(fā)明的新系統(tǒng),已被證明能夠自動破譯消失的語言,且無需對其與其他語言的關系有深入的了解。他們還表明,該系統(tǒng)自身就可以確定語言之間的關系,并可以用它來證實最近的一項表明 Iberian 語言實際上與 Basque 語言無關的學術研究。

語言破譯:從文本到矢量的轉變

此研究由 MIT 教授 Regina Barzilay 牽頭,依賴于基于歷史語言學(historical linguistics)見解的幾項原則。其中一條原則是,一種給定的語言很少會直接添加或刪除整個音節(jié),但是很可能會發(fā)生某些近似發(fā)音的替換。比如,母語中帶有“ p”發(fā)音的單詞可能會在其后代演變中變?yōu)椤?b”,但是由于明顯的發(fā)音差異,變?yōu)椤?k”的可能性則較小。

通過整合這些原則和其他語言學約束,Barzilay 等人的新算法學習將語言發(fā)音嵌入多維向量空間,在該多維空間中,相應矢量之間的距離反映了不同發(fā)音的差異。這種設計使他們能夠捕獲語言變化的相關特征,并將這些特征表達為計算約束(computational constraints)。因此,它可以評估兩種語言之間的相似度。實際上,當對已知語言進行測試時,它甚至可以準確地識別出該語言屬于哪個語系(language families)。例如英語、德語同屬于日耳曼語系。

不僅如此,算法生成的模型可以將古語言中的單詞進行細分,并將其一一映射到“相關”語言中的對應單詞上去。研究團隊的最終目標是使該系統(tǒng)僅僅使用幾千個單詞,就能夠破譯數(shù)十年來語言學家們都無法理解的古語言。

機器翻譯相關研究

實際上,這并非 MIT 首個使用計算機技術破譯已消失語言的研究。

早在 2010 年,Barzilay 就和其他合作者一起,開發(fā)出一個新的計算機算法,該算法在幾個小時內就破解了古老的猶太語言烏加里特語(Ugaritic)。除了幫助破譯“神秘的”八種左右古老語言外,這項工作還可以擴大自動翻譯系統(tǒng)可以處理的語言數(shù)量。例如目前,谷歌翻譯支持103種語言,而破譯系統(tǒng)中使用的技術可以幫助其為數(shù)千種語言構建詞典。

去年,Barzilay 等人也發(fā)表過一篇論文,文中使用改進的計算機算法破譯了線形文字 B(Linear B,出現(xiàn)在公元前 1400 年左右)。他們說,“我們的翻譯腳本能夠以 67.3%的準確率將線性文字 B 的同源詞轉換成對應的希臘語。據(jù)我們所知,該試驗是自動解讀線性文字 B 的第一次嘗試?!?/p>

在未來的工作中,該團隊希望擴展到將文本與已知語言的相關單詞相關聯(lián)的范圍之外,這種方法被稱為“基于同源的破譯方法”。

Barzilay 說:“例如,我們可以識別文本中涉及到的所有人或地點的信息,然后可以根據(jù)已知的歷史證據(jù)對其進行進一步的調查。這些實體識別(entity recognition)方法如今已廣泛用于各種文本處理應用程序中,并且具有很高的準確性 ?!?br /> 責編AJX

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6241

    瀏覽量

    110012
  • 算法
    +關注

    關注

    23

    文章

    4743

    瀏覽量

    96904
  • AI
    AI
    +關注

    關注

    88

    文章

    37213

    瀏覽量

    292018
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    聲智科技AI翻譯耳機重塑智能聽覺體驗

    在日益緊密的全球化浪潮中,跨語言溝通的障礙正在被前沿的聲學AI技術逐步瓦解。聲智AI翻譯耳機,憑借深厚的聲學AI積累,率先實現(xiàn)了“跨語種音色
    的頭像 發(fā)表于 10-21 15:28 ?293次閱讀
    聲智科技<b class='flag-5'>AI</b><b class='flag-5'>翻譯</b>耳機重塑智能聽覺體驗

    國慶出國游,時空壺新T1翻譯機,首個端側模型突破助力跨語言交流

    國慶將至,眾多游客計劃出國旅行,跨語言交流的順暢與否成為影響旅行體驗的重要因素。時空壺新T1翻譯機作為行業(yè)技術領先產(chǎn)品,憑借其獨特優(yōu)勢,為游客在海外的溝通交流保駕護航。新T1作為時空壺翻譯機品類中
    的頭像 發(fā)表于 09-12 12:20 ?710次閱讀
    國慶出國游,時空壺新T1<b class='flag-5'>翻譯</b>機,首個端側模型突破助力跨<b class='flag-5'>語言</b>交流

    翻譯失去網(wǎng)絡,時空壺新T1翻譯機開創(chuàng)首個離線模型賦能全球溝通新體驗

    全球首創(chuàng)的離線端側AI翻譯模型,這一技術突破堪稱行業(yè)變革性創(chuàng)舉。與傳統(tǒng)依賴網(wǎng)絡或僅靠靜態(tài)離線語言包的翻譯設備不同,T1的離線模型基于先進的端側大模型輕量化技術搭建
    的頭像 發(fā)表于 09-08 16:52 ?777次閱讀
    當<b class='flag-5'>翻譯</b>失去網(wǎng)絡,時空壺新T1<b class='flag-5'>翻譯</b>機開創(chuàng)首個離線模型賦能全球溝通新體驗

    聲智科技出席2025年北京市多語種AI語音翻譯大賽

    8月20日,由北京市科委、中關村管委會主辦,北京語言大學、北京第二外國語學院、北京市翻譯協(xié)會、中國人工智能百人會共同承辦的“2025年北京市多語種AI語音翻譯大賽”在中關村展示中心順利
    的頭像 發(fā)表于 08-25 17:18 ?890次閱讀

    RK3576助力智慧安防:8路高清采集與AI識別

    )多路視頻整合難:不同攝像頭采集的畫面需要實時拼接,普通平臺處理延遲高。 2)智能化程度低:缺乏AI分析能力,無法自動識別異常事件。 3)遠程調度受限:視頻傳輸延遲大,無法實時遠程干預
    發(fā)表于 08-22 17:41

    安信可AI人臉識別方案

    作為神仙世界的高科技,"無接觸式開鎖",人臉識別技術也廣泛應用在現(xiàn)代生活中,安信可也有AI人臉識別方案!
    的頭像 發(fā)表于 02-25 14:39 ?642次閱讀
    安信可<b class='flag-5'>AI</b>人臉<b class='flag-5'>識別</b>方案

    Meta與UNESCO合作推動多語言AI發(fā)展

    Meta最近宣布了一項與聯(lián)合國教科文組織(UNESCO)合作的全新計劃——語言技術伙伴計劃。該計劃旨在收集多種語言的語音錄音和文字記錄,以推動未來開放可用的人工智能(AI)技術的發(fā)展,特別關注那些
    的頭像 發(fā)表于 02-08 11:04 ?831次閱讀

    AI助力實時翻譯耳機

    你是否曾經(jīng)因為語言障礙而無法與外國人順暢交流?或者在旅行中因為語言不通而錯過了一些精彩的經(jīng)歷?現(xiàn)在,隨著AI技術的發(fā)展,實時翻譯耳機可以幫你
    的頭像 發(fā)表于 01-24 11:14 ?2735次閱讀
    <b class='flag-5'>AI</b>助力實時<b class='flag-5'>翻譯</b>耳機

    大模型進化論:AI產(chǎn)業(yè)落地將卷向何方?

    大模型進化論:AI產(chǎn)業(yè)落地將卷向何方
    的頭像 發(fā)表于 01-24 09:28 ?451次閱讀

    TSW14J56EVM無法HSDC Pro軟件識別是哪里出了問題?

    近期購買了一批TI公司的器件,其中包括4塊TSW14J56EVM的板子,經(jīng)測試發(fā)現(xiàn),有一塊板子無法HSDC Pro軟件識別,即板子無法與PC無法
    發(fā)表于 12-13 08:21

    LLMWorld上線代碼翻譯新工具——問丫·碼語翻譯俠,快來體驗!

    01. 工具介紹 aicode.llmworld.net 問丫·碼語翻譯俠 是一款由LLMWorld新推出的代碼翻譯工具,支持各種語言之間的翻譯,包括計算機
    的頭像 發(fā)表于 12-09 11:11 ?1523次閱讀
    LLMWorld上線代碼<b class='flag-5'>翻譯</b>新工具——問丫·碼語<b class='flag-5'>翻譯</b>俠,快來體驗!

    IMAX攜手Camb.AI實現(xiàn)影院實時語言翻譯

    近日,據(jù)外媒最新報道,國際知名影院品牌IMAX與總部位于迪拜的人工智能初創(chuàng)公司Camb.AI宣布達成戰(zhàn)略合作,旨在為全球影院觀眾帶來前所未有的實時語言翻譯體驗。 此次合作的核心目標是將IMAX的原創(chuàng)
    的頭像 發(fā)表于 11-26 13:55 ?1060次閱讀

    USB驅動問題:設備無法識別的全面指南!

    今天我把USB驅動問題,關于設備無法識別方面做一個全面指南供大家參考。連接USB無法識別模組設備,是不是驅動問題?今天就一起來聊聊如何排查解決。
    的頭像 發(fā)表于 11-26 12:35 ?1783次閱讀
    USB驅動問題:設備<b class='flag-5'>無法</b><b class='flag-5'>識別</b>的全面指南!

    PCM2707為什么無法電腦識別?

    現(xiàn)在只焊接了最基礎的部分,其它如控制跟I2S接口都還沒連接元件,相當于空接,,現(xiàn)在無法電腦識別,系統(tǒng)WI8-64BIT,我購買的PCM2704的板可以電腦正常
    發(fā)表于 11-06 06:25