chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

智源論壇第4期——《知識與認(rèn)知圖譜》在清華大學(xué)順利舉辦

DPVg_AI_era ? 來源:lq ? 2019-06-07 16:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

5月30日,由北京智源人工智能研究院主辦的智源論壇第4期——《知識與認(rèn)知圖譜》在清華大學(xué)順利舉辦。清華大學(xué)計算機系長聘副教授劉洋針對基于神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)的機器翻譯面臨三大挑戰(zhàn),即知識整合、可解釋/可視化和魯棒性。并針對上述三大挑戰(zhàn)做了團(tuán)隊最新研究與突破工作介紹。

因為人類的語言不通,《圣經(jīng)》故事中的“巴別塔”沒能建成,以失敗告終。如何打破人類語言之間的屏障,也成為了人類一直希望解決的問題。

世界語言分布地圖(來源:維基百科)

地址:

https://en.wikipedia.org/wiki/Linguistic_map

目前,世界上大概有6000多種語言,其中3000多種語言是具有數(shù)學(xué)體系的。正如上圖所示,可以看到不同國家、不同地區(qū)所說的語言是大不相同的。不同語言之間的交流存在非常多的問題,這些問題就是我們通常所說的“語言屏障”。

機器翻譯就是用來解決語言屏障問題非常關(guān)鍵的技術(shù)。

機器翻譯的概念已經(jīng)存在了幾個世紀(jì),但直到20世紀(jì)50年代初才開始成為現(xiàn)實。從那以后,機器翻譯已經(jīng)取得了巨大的進(jìn)步。

機器翻譯的主要任務(wù)就是把一種語言自動翻譯成另外一種語言,看上去就像是函數(shù)映射問題。但是其難點就在于語言本身的復(fù)雜性和種類的多樣性。

世界上的語言按形態(tài)分類可分為:屈折語、黏著語和孤立語。如何將這些語言進(jìn)行轉(zhuǎn)換是機器翻譯要解決的重要問題(三種語言形態(tài)詳細(xì)內(nèi)容見文末)。

1990年以后,特別是互聯(lián)網(wǎng)出現(xiàn)以后,人們得到了大量的可讀文本、機讀文本,所以更傾向于使用數(shù)據(jù)進(jìn)行機器翻譯。這段時期分兩個階段:

第一階段是使用傳統(tǒng)統(tǒng)計方法來(從1990年到2013年),需要且依賴于人寫特征;

第二種階段是采用深度學(xué)習(xí)方法(從2013年至今)。這一階段不需要人寫特征就寫規(guī)則,再后來只需要寫框架即可。

越往后發(fā)展,人類參與程度越精煉?,F(xiàn)在主流方法是數(shù)據(jù)驅(qū)動的方法。

到了2016年,機器翻譯在商業(yè)界基本采用都采用了機器學(xué)習(xí)。其核心思想就是用一個非常復(fù)雜的核心網(wǎng)絡(luò),做非線性函數(shù),把源語言投射到目標(biāo)語言。所以怎么設(shè)計這樣的一個函數(shù),便成了是非常關(guān)鍵的問題。

5月30日,由北京智源人工智能研究院主辦的智源論壇第4期——《知識與認(rèn)知圖譜》在清華大學(xué)順利舉辦。

清華大學(xué)計算機系長聘副教授、博士生導(dǎo)師 劉洋

會中,清華大學(xué)計算機系長聘副教授、博士生導(dǎo)師、智能技術(shù)與系統(tǒng)實驗室主任劉洋老師做了《基于深度學(xué)習(xí)的機器翻譯》精彩報告。

針對上述機器翻譯現(xiàn)狀,劉洋老師認(rèn)為,這種基于神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)的方法面臨三個挑戰(zhàn):

第一是知識整合(Knowledge incorporation)。如何將先驗知識整合到神經(jīng)機器翻譯(NMT)中?

第二是解釋性。如何解釋和理解NMT?

第三是魯棒性。如何使NMT對噪聲具有魯棒性?

對此,劉洋老師分別從上述三方面介紹了其研究重點與突破。

機器翻譯三大挑戰(zhàn):知識整合

如何將知識加入到一些應(yīng)用系統(tǒng)中是非常熱門的一個話題。

劉洋老師表示,數(shù)據(jù)、知識和模型對于整個人工智能是非常要的,研究人員建立一個數(shù)學(xué)模型,從數(shù)據(jù)中學(xué)習(xí)參數(shù),也是某種程度上只是的表示,用同樣的模型解決現(xiàn)實的問題。

而有的時候數(shù)據(jù)量是不夠的,例如愛斯基摩語和維語,幾乎是沒有數(shù)據(jù)可言。像這樣冷門小領(lǐng)域語言的翻譯,由于數(shù)據(jù)的稀缺,翻譯任務(wù)會變得非常棘手。因此可以考慮往里面加入知識。

雖然神經(jīng)機器翻譯近年來取得了很大的進(jìn)展,但是如何將多個重疊的、任意先驗的知識資源整合起來仍然是一個挑戰(zhàn)。針對這個問題,劉洋老師及其團(tuán)隊展開了研究。

arXiv地址:

https://arxiv.org/pdf/1811.01100.pdf

在這項工作中,建議使用后驗正則化來提供一個將先驗知識整合到神經(jīng)機器翻譯中的通用框架。將先驗知識來源表示為一個對數(shù)線性模型的特征,該模型指導(dǎo)神經(jīng)翻譯模型的學(xué)習(xí)過程。漢英翻譯實驗表明,該方法取得了顯著的改進(jìn)。

劉洋老師表示,希望能夠提供一種通用的框架,所有的知識都能往里加。因此這項工作把人類的知識表示成一個空間這是一個符號空間。

然后把深度學(xué)習(xí)的數(shù)字表示另外一個空間,嘗試把這兩個空間關(guān)聯(lián)起來,再通過人類的知識主導(dǎo)這個知識,把傳統(tǒng)知識都壓縮里面,讓它知道深度學(xué)習(xí)的過程,就能夠提供更好的通用框架。

在這項工作中,使用以下特性來編碼知識源。

雙語詞典(bilingual dictionary):

詞表(phrase table):

coverage penalty:

長度比(length ratio):

這項工作與RNNsearch、CPR和PostReg做了比較,性能對比結(jié)果如下:

與RNNsearch、CPR和PostReg的比較

機器翻譯三大挑戰(zhàn):可解釋/可視化

第二個問題就是可解釋或者可視化的問題。

目前,在機器翻譯領(lǐng)域,神經(jīng)機器翻譯因為其較好的性能,已經(jīng)取代統(tǒng)計機器翻譯,成為實際上的主流方法。

大多數(shù)的神經(jīng)機器翻譯都是基于attention機制的encoder-decoder模型,然而這種模型在內(nèi)部傳遞的是浮點數(shù),類似于“黑箱”,難以理解和調(diào)試。

模型如“黑箱”,難以理解和調(diào)試

當(dāng)輸入一個句子和輸出一個句子時,并不知道其生成過程;當(dāng)出現(xiàn)錯誤時,也不知道是什么原因?qū)е碌摹?/p>

所以研究人員迫切希望能夠打開這個黑盒子,知道內(nèi)部信息怎么傳遞的,到底什么原因形成這樣一個錯誤。

針對這個問題,劉洋老師及其團(tuán)隊針對這個問題進(jìn)行了相應(yīng)工作。

論文地址:

https://aclweb.org/anthology/P17-1106

這項工作主要的貢獻(xiàn)包括:

利用層級相關(guān)性傳播算法可視化分析神經(jīng)機器翻譯;

能夠計算任意隱狀態(tài)和任意contextual words的相關(guān)性,同時不要求神經(jīng)網(wǎng)絡(luò)中的函數(shù)必須可求偏導(dǎo),不同于之前只有encoder和decoder隱層之間的對應(yīng)信息;

能夠針對機器翻譯中出錯的例子,進(jìn)行分析。

最近關(guān)于解釋和可視化神經(jīng)模型的工作集中在計算輸入層上的單元對輸出層的最終決策的貢獻(xiàn)。 例如,在圖像分類中,理解單個像素對分類器預(yù)測的貢獻(xiàn)是重要的。

而在這項工作中,團(tuán)隊感興趣的是計算源和目標(biāo)詞對基于注意力的encoder-decoder框架中的內(nèi)部信息的貢獻(xiàn)。

如下圖所示,第三個目標(biāo)詞“York”的生成取決于源上下文(即源句“zai niuyue ”)和目標(biāo)上下文(即部分翻譯“in New”)。

從直觀上看,源詞“niuyue”和目標(biāo)詞“New”與“York”的關(guān)聯(lián)性更強,應(yīng)該比其他詞獲得更高的關(guān)聯(lián)性。問題是如何量化和可視化隱藏狀態(tài)和上下文詞向量之間的相關(guān)性。

研究人員使用逐層相關(guān)傳播(layer-wise relevance propagation,LRP)來計算神經(jīng)元水平相關(guān)性。 使用下圖所示的簡單前饋網(wǎng)絡(luò)來說明LRP的核心思想。

如果要計算 v1和u1之間的相關(guān)性,首先計算v1 和z1、z2之間的相關(guān)性,再將 v1和z1、 z2的相關(guān)性傳遞到u1,從而求得v1和u1之間的相關(guān)性。

對神經(jīng)機器翻譯的LRP算法

通過這樣一種技術(shù),能夠?qū)τ跈C器翻譯中所有的模型都進(jìn)行可視化的分析。

劉洋老師表示,LRP能夠為Transformer生成相關(guān)矩陣。它本身是沒有辦法進(jìn)行分析的,用了這個技術(shù)就可以把輸入、輸出以及內(nèi)部的關(guān)聯(lián)性用可視化的方式呈現(xiàn)出來,這樣可以更好分析運作機制。

團(tuán)隊用在機器翻譯的錯誤分析上,分析了漏詞、重復(fù)翻譯、形成無關(guān)詞,還有否定的反轉(zhuǎn)。

分析翻譯錯誤:詞的省略。第6個源詞“zhong”沒有被正確翻譯。

分析翻譯錯誤:單詞重復(fù)。目標(biāo)詞“history”在翻譯中兩次出現(xiàn)錯誤。

分析翻譯錯誤:不相關(guān)的詞。第9個目標(biāo)詞“forge”與源句完全無關(guān)。

分析翻譯錯誤:否定。第8個否定詞“bu”(not)不翻譯。

機器翻譯三大挑戰(zhàn):魯棒性

第三個問題就是魯棒性。

有這樣一個例子,假設(shè)有一段譯文,輸入的是“《中國電子銀行業(yè)務(wù)管理新規(guī)》將于3月1日起施行”,若是一不小心把“中國”敲成“中方”,后面所有的譯文發(fā)生變化,劉洋老師稱之為蝴蝶效應(yīng)。

這就是現(xiàn)在存在的一個較為現(xiàn)實的問題:輸入中的小擾動會嚴(yán)重扭曲中間表示,從而影響神經(jīng)機器翻譯(NMT)模型的翻譯質(zhì)量。

這是因為深度學(xué)習(xí)是一種全局關(guān)聯(lián)的模型,只要有一點點變化,就會牽一發(fā)而動全身,而這是非常糟糕的。

為了解決這個問題,劉洋老師團(tuán)隊就針對此問題展開了研究。

arXiv地址:

https://arxiv.org/pdf/1805.06130.pdf

在這項研究中,研究人員提出了通過對抗性穩(wěn)定性訓(xùn)練來提高NMT模型的魯棒性。

其基本思想是使NMT模型中的編碼器和解碼器對輸入擾動都具有魯棒性,使它們對原始輸入及其受擾動的對應(yīng)項具有類似的行為。

在這項工作中提出了兩種合成噪聲的產(chǎn)生方法。

Lexical level:

feature level:

在給定一個源字的情況下,它在向量空間中的鄰居可以選擇為一個有噪聲的字。

損失函數(shù)的影響以及主要的實驗結(jié)果如下:

最后,劉洋老師給提供了針對神經(jīng)機器翻譯的開源工具包,有興趣的讀者可以訪問下方鏈接進(jìn)行實驗:

開源工具包地址:

http://thumt.thunlp.org/

附:三種語言形態(tài)詳細(xì)內(nèi)容

孤立語以中文為代表,它由各自獨立且具有完整意義的單詞,通過單純的疊加構(gòu)成文句。

黏著語以烏拉爾阿爾泰語系為中心,通過用助詞、助動詞將獨立的單詞連接起來,完成整個文章的陳述。

屈折語指的是歐洲語系,單詞本身隨著人稱、時態(tài)、格等發(fā)生復(fù)雜的形態(tài)變化。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標(biāo)題:清華劉洋《基于深度學(xué)習(xí)的機器翻譯》,突破知識整合、可解釋和魯棒性三大難關(guān)

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    博世與清華大學(xué)簽約,共同探索碳中和領(lǐng)域前沿技術(shù)研究合作

    4月23日,博世集團(tuán)董事會主席史蒂凡?哈通博士 (Stefan Hartung) 一行訪問清華大學(xué)。校長李路明工字廳東廳會見來賓,并共同出席清華大學(xué)與博世合作簽約儀式,雙方共同探索碳
    的頭像 發(fā)表于 04-27 09:59 ?27次閱讀
    博世與<b class='flag-5'>清華大學(xué)</b>簽約,共同探索碳中和領(lǐng)域前沿技術(shù)研究合作

    高德地圖攜手清華大學(xué)共建低空異構(gòu)載具智能控制北京市重點實驗室

    4月19日,清華大學(xué)昌平南口國重基地迎來一件“未來感”十足的大事——“低空異構(gòu)載具智能控制北京市重點實驗室”(下稱低空北重)正式揭牌成立,低空經(jīng)濟(jì)高端論壇也同步舉辦。 聽起來有點專業(yè)?
    的頭像 發(fā)表于 04-24 15:43 ?150次閱讀

    清華大學(xué)體育鍛煉數(shù)字化案例:基于藍(lán)牙物聯(lián)網(wǎng)的學(xué)生運動健康管理

    的恢復(fù)。校黨委書記邱勇也強調(diào),體育人才培養(yǎng)中發(fā)揮著重要作用,要堅持健康第一的教育理念,推動學(xué)生體育鍛煉全覆蓋。 為應(yīng)對這一挑戰(zhàn),清華大學(xué)引入北京桂花網(wǎng)的藍(lán)牙物聯(lián)網(wǎng)解決方案,旨在解決傳統(tǒng)體育鍛煉中存在
    發(fā)表于 04-15 17:31

    清華大學(xué)電子工程系到訪天數(shù)智芯參觀交流

    近日,清華大學(xué)電子工程系、清華校友總會電子工程系分會、清華大學(xué)上海校友會電子信息專委會組織師生、校友代表到訪天數(shù)智芯,開展深度校企交流活動,共話國產(chǎn)算力創(chuàng)新與產(chǎn)學(xué)研協(xié)同發(fā)展。
    的頭像 發(fā)表于 04-07 17:40 ?1573次閱讀

    清華大學(xué)“啟·創(chuàng)”計劃走進(jìn)拓維信息,校企共探AI時代產(chǎn)學(xué)研合作新范式

    1月13日,清華大學(xué)“啟·創(chuàng)”計劃第十三期赴湘社會實踐活動暨TalkwebHouse創(chuàng)業(yè)私董會第二拓維信息圓滿舉辦。清華大學(xué)創(chuàng)業(yè)團(tuán)隊20
    的頭像 發(fā)表于 01-16 14:04 ?693次閱讀
    <b class='flag-5'>清華大學(xué)</b>“啟·創(chuàng)”計劃走進(jìn)拓維信息,校企共探AI時代產(chǎn)學(xué)研合作新范式

    沐曦與Arm、熠知一同到訪清華大學(xué)交流座談

    為助力頂尖學(xué)府清華大學(xué)“AI+教科研”領(lǐng)域取得新突破,培養(yǎng)具備AI創(chuàng)新能力的人才,1月12日,沐曦集成電路(上海)股份有限公司(股票代碼:688802)、半導(dǎo)體頭部企業(yè)Arm控股有限公司(納斯達(dá)克
    的頭像 發(fā)表于 01-14 13:52 ?497次閱讀

    ??低暳料嗟谌龑?b class='flag-5'>清華質(zhì)量強國論壇

    近日,由清華大學(xué)質(zhì)量與可靠性研究院、清華大學(xué)工業(yè)工程系主辦的第三屆 “清華質(zhì)量強國論壇” 在京舉行。作為第五屆中國質(zhì)量獎獲獎企業(yè),??低暿苎麉?,質(zhì)量管理部總經(jīng)理石炎明圍繞《“數(shù)智質(zhì)
    的頭像 發(fā)表于 12-16 14:34 ?689次閱讀

    普華基礎(chǔ)軟件走進(jìn)清華大學(xué)研究生課堂

    近日,普華基礎(chǔ)軟件走進(jìn)清華大學(xué)車輛與運載學(xué)院,《車輛控制工程》課堂上開展研究生專題授課和交流。本次授課聚焦智能駕駛汽車基礎(chǔ)軟件發(fā)展與關(guān)鍵技術(shù),旨在搭建校企知識傳遞橋梁,為高校學(xué)子帶來產(chǎn)業(yè)前沿視角,助力培養(yǎng)符合行業(yè)需求的復(fù)合型人
    的頭像 發(fā)表于 11-26 15:53 ?494次閱讀

    愛芯元智出席第四屆清華大學(xué)汽車芯片設(shè)計及產(chǎn)業(yè)應(yīng)用研討會

    近日,第四屆清華大學(xué)汽車芯片設(shè)計及產(chǎn)業(yè)應(yīng)用研討會暨校友論壇蘇州市吳江區(qū)舉行。作為清華大學(xué)自動化系校友,愛芯元智創(chuàng)始人兼董事長仇肖莘博士應(yīng)邀發(fā)表主旨演講,深入剖析了高智價比AI芯片推動
    的頭像 發(fā)表于 11-02 09:18 ?563次閱讀

    普華基礎(chǔ)軟件出席第四屆清華大學(xué)汽車芯片設(shè)計及產(chǎn)業(yè)應(yīng)用研討會

    10月25日,第四屆清華大學(xué)汽車芯片設(shè)計及產(chǎn)業(yè)應(yīng)用研討會暨校友論壇蘇州舉行。普華基礎(chǔ)軟件副總經(jīng)理兼戰(zhàn)略研究院院長張曉先受邀出席,與來自產(chǎn)業(yè)鏈關(guān)鍵環(huán)節(jié)的嘉賓圍繞汽車芯片技術(shù)突破路徑、產(chǎn)業(yè)協(xié)同機制、資本賦能模式及產(chǎn)學(xué)研協(xié)同等核心議
    的頭像 發(fā)表于 10-29 10:41 ?726次閱讀

    清華大學(xué)五道口金融學(xué)院走進(jìn)賽目科技

    近日,聚焦自動駕駛未來路徑的專題沙龍中關(guān)村國際創(chuàng)新大廈成功舉辦。此次活動由清華大學(xué)五道口金融學(xué)院主辦,北京賽目科技股份有限公司、北京海新域城市更新集團(tuán)提供活動支持,為清華-康奈爾雙學(xué)
    的頭像 發(fā)表于 07-18 16:15 ?920次閱讀

    清華大學(xué)TOP EE+項目參訪美光上海

    此前,2025年6月4日至6日,清華大學(xué)TOP EE+ 項目于美光上海的參訪活動圓滿舉行。為期三天的活動匯聚了來自清華大學(xué)電子工程系的優(yōu)秀留學(xué)生與美光的多位管理者和工程師,展開了深入的技術(shù)交流與文化互動之旅。
    的頭像 發(fā)表于 07-07 18:02 ?1660次閱讀

    導(dǎo)遠(yuǎn)科技與清華大學(xué)無錫應(yīng)用技術(shù)研究院達(dá)成合作

    近日,導(dǎo)遠(yuǎn)科技與清華大學(xué)無錫應(yīng)用技術(shù)研究院(以下簡稱:研究院)達(dá)成合作。導(dǎo)遠(yuǎn)科技將提供高精度定位產(chǎn)品及解決方案,以支持研究院L4級自動駕駛和人形機器人領(lǐng)域的技術(shù)研發(fā)及轉(zhuǎn)化落地。
    的頭像 發(fā)表于 06-12 16:34 ?1222次閱讀

    清華大學(xué)到鎵未來科技,張大江先生在半導(dǎo)體功率器件十八年的堅守!

    清華大學(xué)到鎵未來科技,張大江先生在半導(dǎo)體功率器件十八年的堅守!近年來,珠海市鎵未來科技有限公司(以下簡稱“鎵未來”)第三代半導(dǎo)體行業(yè)異軍突起,憑借領(lǐng)先的氮化鎵(GaN)技術(shù)儲備和不斷推出的新產(chǎn)品
    發(fā)表于 05-19 10:16

    清華大學(xué)攜手華為打造業(yè)內(nèi)首個園區(qū)網(wǎng)絡(luò)智能體

    清華大學(xué)響應(yīng)國家教育新基建戰(zhàn)略,正在加速推進(jìn)網(wǎng)絡(luò)管理平臺升級:為滿足在線教育、協(xié)同創(chuàng)新及智慧校園的發(fā)展需求,為清華大學(xué)躋身世界一流大學(xué)創(chuàng)造基礎(chǔ)條件,清華大學(xué)攜手華為打造業(yè)內(nèi)首個園區(qū)網(wǎng)絡(luò)
    的頭像 發(fā)表于 05-07 09:51 ?982次閱讀