深圳 - 騰訊AI Lab今日發(fā)布了一款A(yù)I輔助翻譯產(chǎn)品 - “騰訊輔助翻譯”(Transmart),可滿足用戶快速翻譯的需求,用AI輔助人工翻譯提高效率和質(zhì)量。該產(chǎn)品采用業(yè)內(nèi)領(lǐng)先的人機(jī)交互式機(jī)器翻譯技術(shù),融合神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯、統(tǒng)計(jì)機(jī)器翻譯、輸入法、語義理解、數(shù)據(jù)挖掘等多項(xiàng)前沿技術(shù),配合億級(jí)雙語平行數(shù)據(jù),為用戶提供實(shí)時(shí)智能翻譯輔助,幫助用戶更好更快地完成翻譯任務(wù)。產(chǎn)品旨在致敬人工翻譯,輔助人工翻譯更快、更好地完成任務(wù),探索人工智能賦能翻譯行業(yè)新思路。
Transmart 核心功能簡(jiǎn)介
“騰訊輔助翻譯”目前專注于中英互譯功能,這占國(guó)內(nèi)翻譯業(yè)務(wù)80%以上,希望將中英互譯的用戶體驗(yàn)極致化。目前產(chǎn)品全面開放,普通用戶可登錄網(wǎng)頁,翻譯行業(yè)合作伙伴可直接調(diào)用多個(gè)應(yīng)用程序接口,包括交互式機(jī)器翻譯、輔助翻譯輸入法、個(gè)性化機(jī)器翻譯、定制化機(jī)器翻譯等。產(chǎn)品同時(shí)提供私有化部署,可將全套系統(tǒng)安裝到用戶本地網(wǎng)絡(luò),保證業(yè)務(wù)數(shù)據(jù)安全。
近年來,隨著神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯技術(shù)的快速發(fā)展,機(jī)器翻譯譯文質(zhì)量不斷提升,機(jī)器翻譯取代人工翻譯的論調(diào)也甚囂塵上。騰訊輔助翻譯團(tuán)隊(duì)認(rèn)為,在實(shí)際操作中,現(xiàn)階段的機(jī)器翻譯譯文經(jīng)常錯(cuò)漏百出,在完全沒有人工干預(yù)的情況下,機(jī)器翻譯譯文的準(zhǔn)確率并不能達(dá)到具體應(yīng)用領(lǐng)域的翻譯要求,如商業(yè)合同、法律條文、專業(yè)書籍、學(xué)術(shù)文獻(xiàn)、旅游文本等。一名合格的職業(yè)翻譯不僅需要長(zhǎng)期的專業(yè)刻苦訓(xùn)練,還要具備大量的實(shí)戰(zhàn)經(jīng)驗(yàn),才有可能勝任具體專業(yè)領(lǐng)域的翻譯工作。在實(shí)際的應(yīng)用場(chǎng)景下,目前機(jī)器翻譯譯文的準(zhǔn)確率還無法與專業(yè)人工翻譯匹敵。
但是,因?yàn)橛?jì)算能力增強(qiáng)、機(jī)器翻譯模型創(chuàng)新、語料規(guī)模大幅提升,機(jī)器翻譯譯文質(zhì)量較之前已有明顯改善,翻譯速度也遠(yuǎn)勝人工翻譯?,F(xiàn)階段,機(jī)器翻譯可提供譯文參考,幫助人工翻譯完成一部分相對(duì)機(jī)械的任務(wù),讓人工翻譯從繁雜低效的打字、查詞等體力勞動(dòng)中解脫出來,將精力投入到更高層次的譯文創(chuàng)作中。在機(jī)器翻譯等人工智能技術(shù)輔助人工翻譯過程中,人工翻譯將獲得個(gè)性化機(jī)器翻譯結(jié)果。通過人工與機(jī)器之間的互動(dòng),進(jìn)一步提升翻譯效率和質(zhì)量。機(jī)器翻譯不能替代人工翻譯,但將重構(gòu)人工翻譯過程,騰訊輔助翻譯正是基于這種理念而開發(fā)出來的技術(shù)創(chuàng)新產(chǎn)品,旨在提升人工翻譯效率和翻譯質(zhì)量,滿足日益增長(zhǎng)的翻譯需求。
騰訊輔助翻譯產(chǎn)品采用了團(tuán)隊(duì)自研的人機(jī)交互式機(jī)器翻譯技術(shù),是一款人工智能輔助翻譯互聯(lián)網(wǎng)落地產(chǎn)品。人機(jī)交互式機(jī)器翻譯技術(shù)專門針對(duì)人工翻譯過程,是人工智能輔助翻譯系統(tǒng)的核心技術(shù)。與一般的機(jī)器翻譯相比,人機(jī)交互式機(jī)器翻譯的重要特征是允許用戶實(shí)時(shí)干預(yù)譯文生成,提供交互式機(jī)器翻譯、翻譯輸入法、實(shí)時(shí)譯文建議等高效交互手段以提高人工翻譯效率。騰訊輔助翻譯實(shí)現(xiàn)了兩個(gè)“第一”:
1、內(nèi)核是國(guó)內(nèi)第一個(gè)公開的交互式機(jī)器翻譯的互聯(lián)網(wǎng)落地產(chǎn)品;
2、搭載了業(yè)內(nèi)第一個(gè)公開的融合機(jī)器翻譯的輔助翻譯輸入法。該產(chǎn)品融合了人工智能和傳統(tǒng)輔助翻譯技術(shù),為用戶提供更便捷、流暢的人工翻譯體驗(yàn)。
騰訊輔助翻譯具體功能亮點(diǎn)如下:
交互式機(jī)器翻譯
首個(gè)公開的交互式機(jī)器翻譯互聯(lián)網(wǎng)落地產(chǎn)品,根據(jù)輸入內(nèi)容實(shí)時(shí)更新自動(dòng)譯文,顯著提升翻譯效率。
交互式機(jī)器翻譯基于自主實(shí)現(xiàn)的約束翻譯解碼技術(shù),在提升譯文準(zhǔn)確性的同時(shí),解碼速度也被優(yōu)化到滿足互聯(lián)網(wǎng)環(huán)境中實(shí)時(shí)交互的要求。實(shí)時(shí)解碼速度是影響交互式機(jī)器翻譯產(chǎn)品落地的關(guān)鍵因素。結(jié)合已有積累,騰訊AI Lab設(shè)計(jì)并實(shí)現(xiàn)了專用于人機(jī)交互的神經(jīng)機(jī)器翻譯系統(tǒng)。與普通機(jī)器翻譯不同,交互式機(jī)器翻譯的挑戰(zhàn)主要在于無法預(yù)測(cè)用戶動(dòng)作,從而難以通過對(duì)原文建立緩存等常規(guī)方法來加快響應(yīng)速度。騰訊AI Lab不斷攻克技術(shù)難關(guān),并一直致力于創(chuàng)造用戶體驗(yàn)更佳的交互式機(jī)器翻譯產(chǎn)品。
輔助翻譯輸入法
首個(gè)融合機(jī)器翻譯的輔助翻譯輸入法產(chǎn)品,比普通輸入法更少的按鍵數(shù),顯著減少打字時(shí)間。更快捷的拼音轉(zhuǎn)漢字、更準(zhǔn)確的單詞補(bǔ)全,讓用戶享受翻譯過程。
普通輸入法因?yàn)殡y以感知翻譯場(chǎng)景中的上下文信息,在準(zhǔn)確性和個(gè)性化方面還有較大的提升空間。與普通輸入法相比,輔助翻譯輸入法可利用統(tǒng)計(jì)機(jī)器翻譯和神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯的知識(shí),極大提升自動(dòng)組詞和推薦短語的準(zhǔn)確性,同時(shí)使輸入預(yù)測(cè)更具個(gè)性化。
自主實(shí)現(xiàn)的輸入法知識(shí)挖掘算法,持續(xù)從海量互聯(lián)網(wǎng)數(shù)據(jù)、億級(jí)雙語句對(duì)中抽取片斷翻譯知識(shí),以此作為輔助翻譯輸入法的基礎(chǔ)。在翻譯過程中,再實(shí)時(shí)融合當(dāng)前句子的機(jī)器翻譯上下文信息,輔助用戶快速完成翻譯任務(wù)。
比如翻譯英文句子“Jane Zhang became the first Chinese singer to perform for Victoria's Secret, joining the ranks of Taylor Swift and Katy Perry.”時(shí),自動(dòng)機(jī)器翻譯錯(cuò)誤地把張靚穎的英文名“Jane Zhang”翻譯成了“簡(jiǎn)·張”:
當(dāng)用QQ拼音輸入法時(shí),需要輸入“zhangliangy”共11個(gè)字母才能得到正確的“張靚穎”。
但是,采用輔助翻譯輸入法之后,因?yàn)橛袛?shù)據(jù)挖掘和機(jī)器翻譯知識(shí)的支撐,只需要輸入“zl”就可以得到期望的結(jié)果。
由此可見,輔助翻譯輸入法能夠通過減少打字敲鍵數(shù),提升人工翻譯效率。
實(shí)時(shí)譯文建議
基于自研的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯引擎,提供靈活、準(zhǔn)確的實(shí)時(shí)譯文片斷智能推薦,并可根據(jù)用戶翻譯歷史和習(xí)慣不斷學(xué)習(xí),提供更貼合用戶期待的個(gè)性化譯文建議。
因目前階段的機(jī)器翻譯技術(shù)所限,機(jī)器譯文的準(zhǔn)確率并不高,因此提供的實(shí)時(shí)譯文建議不能太長(zhǎng),否則會(huì)降低人工翻譯效率。實(shí)時(shí)譯文建議的難題就在于如何提供長(zhǎng)度適中、準(zhǔn)確率也比較高的短語或者子句。為此,騰訊 AI Lab 提出并實(shí)現(xiàn)了譯文智能推薦算法,綜合統(tǒng)計(jì)機(jī)器翻譯、神經(jīng)機(jī)器翻譯等技術(shù),盡量為用戶提供最合適的譯文建議。
比如,在翻譯句子“首屆中國(guó)國(guó)際進(jìn)口博覽會(huì)即將于11月5日開幕。”時(shí),智能推薦算法發(fā)現(xiàn)機(jī)器譯文將“開幕”一詞翻譯為“open”,但是在相對(duì)正式的文本中,翻譯為“...be held”更恰當(dāng)。智能推薦預(yù)測(cè)用戶可能會(huì)在此處進(jìn)行修改,就縮短了推薦片段,只推薦“...will”,方便用戶直接采用。
千萬級(jí)專業(yè)術(shù)語、億級(jí)例句參照
與傳統(tǒng)輔助翻譯軟件相比,智能譯文建議的來源不再局限于用戶導(dǎo)入的術(shù)語庫,而是全面綜合互聯(lián)網(wǎng)海量數(shù)據(jù)。騰訊AI Lab從幾百TB的互聯(lián)網(wǎng)文本中挖掘了數(shù)千萬的專業(yè)術(shù)語翻譯和億級(jí)雙語例句提供給用戶作為翻譯參考信息。然后以句子為維度關(guān)聯(lián)展示術(shù)語庫、例句庫等參考信息,滿足用戶多領(lǐng)域、多文體的翻譯需求。
輔助翻譯API與定制化服務(wù)
為合作伙伴開放交互式機(jī)器翻譯、輔助翻譯輸入法、個(gè)性化機(jī)器翻譯API、定制化機(jī)器翻譯等多個(gè)應(yīng)用程序接口,提供定制化服務(wù)。輔助翻譯API與定制化服務(wù)相關(guān)事宜,可以聯(lián)系transmart@tencent.com。
騰訊輔助翻譯由騰訊AI Lab的內(nèi)部團(tuán)隊(duì)歷時(shí)一年完成。騰訊AI Lab是騰訊的企業(yè)級(jí)AI實(shí)驗(yàn)室,于2016年4月成立,目前在中國(guó)和美國(guó)有70位頂尖研究科學(xué)家及300位應(yīng)用工程師。自然語言處理(Natural Language Processing,簡(jiǎn)稱NLP)是四大主要研究領(lǐng)域之一。NLP團(tuán)隊(duì)致力于追蹤和研究最前沿的自然語言文本理解和生成技術(shù),并孵化下一代自然語言處理技術(shù)與商業(yè)應(yīng)用場(chǎng)景。團(tuán)隊(duì)科學(xué)家已在前沿理論研究上取得諸多創(chuàng)造性成果,在應(yīng)用探索方面,其文本理解、文本生成、對(duì)話和機(jī)器翻譯等技術(shù)已應(yīng)用于公司諸多產(chǎn)品,提升產(chǎn)品智能化以更好服務(wù)用戶。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4814瀏覽量
103673 -
AI
+關(guān)注
關(guān)注
88文章
35168瀏覽量
280112 -
騰訊
+關(guān)注
關(guān)注
7文章
1678瀏覽量
50313
原文標(biāo)題:騰訊發(fā)布人工智能輔助翻譯
文章出處:【微信號(hào):jingzhenglizixun,微信公眾號(hào):機(jī)器人博覽】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學(xué)習(xí)課程參考2025版(大模型篇)
賽美特“AI智造”生態(tài)體系亮相,四大方向賦能智能制造
騰訊AI助手“騰訊元寶”重大更新:支持深度思考功能
AI助力實(shí)時(shí)翻譯耳機(jī)

評(píng)論