7月5日消息,阿里達摩院宣布開源新一代人機對話模型ESIM。該算法模型提出兩年多,已被200多篇論文引用,更曾在國際頂級對話系統(tǒng)評測大賽(DSTC7)上獲得雙料冠軍,將人機對話準確率的紀錄提升至94.1%。
ESIM模型還被用來評測一些新提出的數(shù)據(jù)集,比如來自紐約大學(xué)的MultiNLI數(shù)據(jù)集、最近大熱的來自華盛頓大學(xué)的SWAG數(shù)據(jù)集、NAACL19 Best Resource Paper常識知識QA數(shù)據(jù)集CommonsenseQA等等。
據(jù)介紹,比起業(yè)界使用最為廣泛的LSTM模型,ESIM人機對話回復(fù)模型回復(fù)準確率更高。采用全新ESIM模型的人機對話回復(fù)模型,比LSTM模型回復(fù)準確率提升25%(數(shù)據(jù)來自ICASSP2019論文中Ubuntu測試集的數(shù)據(jù))。
陳謙參加第七屆對話系統(tǒng)技術(shù)挑戰(zhàn)賽
ESIM模型最初由達摩院語音實驗室內(nèi)的90后科學(xué)家陳謙(花名潭清)研發(fā),他博士畢業(yè)于中科大,是達摩院中最年輕的科學(xué)家之一,也是2018屆的阿里星(阿里星是專門針對高校頂尖人才的一個培養(yǎng)計劃,從應(yīng)屆畢業(yè)生中經(jīng)過層層篩選,由技術(shù)帶頭人擔(dān)任主管,進行重點培養(yǎng),每年的阿里星平均只有20人不到)。
在去年DSTC 7對話系統(tǒng)評測大賽上,ESIM在NOESIS賽道中從麻省理工學(xué)院、約翰霍普金斯大學(xué)、IBM研究院等近20支參賽隊伍中拿下該賽道兩項比賽的冠軍。NOESIS賽道考察AI的人機對話能力,要求AI根據(jù)給定的多輪人機對話歷史,從成百到上萬個句子中選出正確的回復(fù)。

ESIM模型的原理論文已于2017年發(fā)表在國際頂級自然語言處理會議ACL 2017,阿里巴巴此次開源的模型原理論文發(fā)表在了今年國際頂級語音會議ICASSP 2019上,在公開的標準數(shù)據(jù)集Ubuntu(英文)和E-commerce(中文)上均取得了目前最高的成績。
人機對話系統(tǒng)及其背后的認知智能,為讓機器快速準確理解人類的表達,ESIM給AI裝上一套“雷達”系統(tǒng),賦予它實時檢索對話歷史、自動去除干擾信息的能力,使它能夠給出人類期待的回復(fù)。
目前,這一模型已在基于ESIM模型研發(fā)的智能語音點餐機、地鐵語音售票機等應(yīng)用中落地,還可能將給智能客服、導(dǎo)航軟件、智能音箱等應(yīng)用場景帶去改變。
-
AI
+關(guān)注
關(guān)注
90文章
38225瀏覽量
297091 -
阿里
+關(guān)注
關(guān)注
6文章
462瀏覽量
34043
原文標題:阿里90后科學(xué)家研發(fā),達摩院開源新一代AI算法模型
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄

阿里90后科學(xué)家研發(fā),達摩院開源新一代AI算法模型
評論