近年來隨著深度學習和神經(jīng)網(wǎng)絡(luò)技術(shù)的發(fā)展,機器翻譯也取得了長足的進步。神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)越來越復雜,但我們始終無法解釋內(nèi)部發(fā)生了什么,“黑箱問題”一直困擾著我們。我們不清楚程序在翻譯過程中如何進行決策,所以當翻譯出錯時也很難改正。隨著深度學習在各行各業(yè)中的廣泛應(yīng)用,深度學習的不可解釋性已經(jīng)成為其面臨的嚴峻挑戰(zhàn)之一。
今年,在德國柏林舉辦的 IEEE VAST 可視化分析大會上,來自 IBM 和哈佛大學的研究人員展示了為解決翻譯中的 AI 黑盒問題所開發(fā)的調(diào)試工具。這款名為 Seq2Seq-Vis 的工具能將人工智能的翻譯過程進行可視化,方便開發(fā)人員對模型進行調(diào)試。
Seq2Seq-Vis 主要針對機器翻譯中最常用的 Seq2Seq模型。這一模型能夠?qū)⑷我忾L度的序列,也就是原文的句子,映射到目標語言。除了機器翻譯任務(wù),在自動問答、文本摘要等任務(wù)中也都主要應(yīng)用 Seq2Seq模型。
簡單來說,Seq2Seq模型在機器翻譯中的工作原理就是把源語言映射到目標語言,得到了目標語言的序列(也就是初步翻譯完的句子)后再進行優(yōu)化,保證語法和語義上的正確。雖然使用神經(jīng)網(wǎng)路模型后,機器翻譯的結(jié)果得到了很大的提升,但同時也非常復雜。
可視化機器翻譯的過程
研究人員稱研發(fā) Seq2Seq-Vis 的初衷是想有一個類似于基于規(guī)則的傳統(tǒng)翻譯軟件中的規(guī)則表,這樣開發(fā)人員可以通過在規(guī)則表中對照得到錯誤信息就可以很簡單地修改模型。
Seq2Seq-Vis.io 網(wǎng)站上給出了一個從德語到英語的演示程序。德語的“die l?ngsten reisen fangen an , wenn es auf den stra?en dunkel wird.”翻譯成英語應(yīng)該是“The longest journeys begin when it gets dark in the streets.”,但被機器翻譯成了“the longest travel begins when it gets to the streets.”Seq2Seq-Vis 以可視化的方式呈現(xiàn)出了序列到序列模型翻譯的每一步,這樣用戶就能像查找規(guī)則表一樣來找出機器翻譯翻譯錯誤的原因。
Seq2Seq-Vis 另一個很有用的功能是它能找出與某個字詞相關(guān)的訓練集,這也是解決 AI 黑盒問題的一大難點。其實一個機器學習模型除了訓練集一無所知,所以要解決機器翻譯中的錯誤最終都要回到訓練集中去。
將機器翻譯過程可視化,用戶就能確定翻譯出錯到底是編碼器解碼器使用的訓練樣本出了錯還是注意力模型的設(shè)置或者其他環(huán)節(jié)出錯了。
更正序列到序列模型
Seq2Seq-Vis 并不是第一個試圖解決 AI 黑盒問題的工具,之前有很多大公司和研究機構(gòu)都有進行嘗試,甚至 IBM 自己也在這上面下過功夫。事實上,很多類似的工具需要的信息比 Seq2Seq-Vis 更少,比如有的工具只需要神經(jīng)網(wǎng)絡(luò)的輸出就可以,而 Seq2Seq-Vis 還需要訓練集,整個模型的架構(gòu)和設(shè)置。但 Seq2Seq-Vis 卻是第一個既能可視化模型的決策過程也能讓開發(fā)人員直接修改模型的工具。開發(fā)人員可以通過可視化的方式對模型的決策過程進行修改并觀察反饋來實現(xiàn)探索式的調(diào)試,比如修改輸出序列的單詞或者對注意力模型的配置進行修改。
聽起來是不是很酷,不過Seq2Seq-Vis 的目標群體是模型架構(gòu)師或工程師而非機器翻譯的終端用戶。因為要讓這一工具真正發(fā)揮作用需要用戶對“序列到序列”模型有較為深入的了解。雖然目標這一工具還只是應(yīng)用在IBM的內(nèi)部項目中,但它是開源的,所以大家都可以來試試。
-
人工智能
+關(guān)注
關(guān)注
1807文章
49029瀏覽量
249585 -
機器學習
+關(guān)注
關(guān)注
66文章
8503瀏覽量
134635 -
機器翻譯
+關(guān)注
關(guān)注
0文章
140瀏覽量
15198
原文標題:開源 | IBM、哈佛共同研發(fā):Seq2Seq模型可視化工具
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
如何使用協(xié)議分析儀進行數(shù)據(jù)分析與可視化
VirtualLab Fusion應(yīng)用:3D系統(tǒng)可視化
可視化組態(tài)物聯(lián)網(wǎng)平臺是什么
函數(shù)HAL_I2C_Slave_Seq_Transmit_IT和HAL_I2C_Slave_Seq_Receive_IT實現(xiàn)代碼里有處理DMA請求,這是出于什么考慮?
VirtualLab Fusion中的可視化設(shè)置
VirtualLab Fusion應(yīng)用:光波導k域布局可視化(“神奇的圓環(huán)”)
七款經(jīng)久不衰的數(shù)據(jù)可視化工具!
光學系統(tǒng)的3D可視化
焊接過程可視化的應(yīng)用前景有哪些

《AI for Science:人工智能驅(qū)動科學創(chuàng)新》第6章人AI與能源科學讀后感
AI for Science:人工智能驅(qū)動科學創(chuàng)新》第4章-AI與生命科學讀后感
名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅(qū)動科學創(chuàng)新
工業(yè)數(shù)據(jù)可視化管理平臺是什么
【飛凌嵌入式】基于RK3576的電力站房智能輔助與人工智能可視化網(wǎng)關(guān)方案

評論