chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NLP的兩個部分:NLU和NLG

GKwL_infoqchina ? 來源:InfoQ ? 2019-12-12 14:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

比爾·蓋茨曾說過,「語言理解是人工智能皇冠上的明珠」。自然語言處理的進步將會推動人工智能整體進展。NLP 的歷史幾乎跟計算機和人工智能的歷史一樣長。自計算機誕生,就開始有了對人工智能的研究,而人工智能領域最早的研究就是機器翻譯以及自然語言理解。

隨著大數(shù)據(jù)和技術設施的完善,人工智能技術在近年來迎來了井噴式的發(fā)展。在產業(yè)方面,不少專注于計算機視覺的公司也獲得了長足發(fā)展。其中比較具有代表性的是估值已經超過 20 億美元的商湯科技,在經歷了數(shù)輪大額融資之后,其隱隱有從獨角獸變成巨頭的趨勢。

不過,人工智能另一個相關領域自然語言處理似乎沒有達到這種高度。在技術方面,這一領域的技術準確率遠遠沒有達到計算機視覺和語音識別的水平,技術產品也因為較高的錯誤率,缺少實際價值。那么 NLP 技術到底有哪些難點呢?

什么是 NLP?

在人工智能出現(xiàn)之前,計算機只能處理結構化的數(shù)據(jù),就比如我們平時用的表格里的數(shù)據(jù),但是網(wǎng)絡中大部分的數(shù)據(jù)都是非結構化的,比如我們看到的文章、圖片、視頻等等。在這些數(shù)據(jù)中,文本數(shù)據(jù)又往往是最多的,為了能夠分析和利用這些文本信息,我們就需要利用 NLP 技術,讓機器理解這些文本信息,并加以利用。

人類可以通過語言來交流,而為了讓計算機之間互相交流,人們讓所有計算機都遵守一些規(guī)則,計算機的這些規(guī)則就是計算機之間的語言。自然語言處理(NLP)就是在機器語言和人類語言之間溝通的橋梁,以實現(xiàn)人機交流的目的。

NLP 的兩個部分:NLU 和 NLG

自然語言理解(NLU) 則是 NLP 的一部分,這幾年深度學習技術的發(fā)展使 NLU 能在一些場景中落地。自然語言理解就是希望機器像人一樣,具備正常人的語言理解能力,由于自然語言在理解上有很多難點 (下面詳細說明),所以 NLU 是至今還遠不如人類的表現(xiàn)。

NLU 目前應用的領域主要集中在機器翻譯、機器客服、智能音箱等領域,但由于需要大量的數(shù)據(jù)訓練和 NLU 本身存在的一些語言語義上的難點,其實機器還不是非常智能。

自然語言生成(NLG)是 NLP 的重要組成部分,NLU 負責理解內容,NLG 負責生成內容。他的主要目的是降低人類和機器之間的溝通鴻溝,將非語言格式的數(shù)據(jù)轉換成人類可以理解的語言格式。

自然語言生成 – NLG 有 2 種方式:

text – to – text:文本到語言的生成

data – to – text :數(shù)據(jù)到語言的生成

NLP 的難點

對于機器來說,難點主要分為 5 類問題:

語言的多樣性,我們日常所用的語言是沒有規(guī)律的,不同的組合可以表達出很多的含義。

語言的歧義性,如果不聯(lián)系上下文,缺少環(huán)境的約束,語言有很大的歧義性

語言是一個開放集合,我們可以任意的發(fā)明創(chuàng)造一些新的表達方式。

語言需要知識依賴,需要聯(lián)系到實踐知識。

語言的上下文

應用場景復雜,很難出現(xiàn)“獨角獸”

總的來說,NLP 技術領域之所以沒有出現(xiàn)如計算機視覺領域那些獨角獸公司,是因為自然語言處理的技術難度太大,和應用場景太復雜。一個公司的成立發(fā)展都是由需求驅動的,自然語言應用主要是機器翻譯,雖然機器翻譯的需求長期存在,但機器翻譯的水平一直未取得突破性的進展,即使到今天,機器也很難翻譯有背景的復雜句子。

另外,自然語言處理的應用太依賴于UI了。圖像識別基本不需要 UI,直接在系統(tǒng)內部集成一些技術就行。一些公司做翻譯軟件,如果UI做得不行,用戶體驗不行,人們就不會愿意使用。

技術產業(yè)化最重要的是商業(yè)模式,也就是怎么讓技術掙錢。圖像識別公司的掙錢模式已經成立了,但翻譯付費就難多了。所以自然語言是從研究到技術到落地到商業(yè)化,面臨一系列的挑戰(zhàn)。目前的現(xiàn)狀是,自然語言處理技術更多的是作為公司內部技術,比如內部的商業(yè)情報或人機接口功能。

NLP 技術發(fā)展,未來可期

從今年的 ACL 大會可以看出 NLP 技術的火爆。會議共收到了 2900 余篇提交的論文,投稿規(guī)模相較于 2018 年增長了 75%!自然語言處理領域實在是炙手可熱,學術界和工業(yè)界的熱情都創(chuàng)下了歷史新高。

從商業(yè)層面來講也涌現(xiàn)出了微軟小冰、小米小愛等比較成熟的機器人產品,相信在未來的不久 NLP 技術一定會給我們帶來更多的驚喜。

大咖現(xiàn)場分享 NLP 技術干貨

王斌博士,是小米人工智能實驗室主任,NLP 首席科學家。中國中文信息學會理事,計算語言學、信息檢索、社會媒體處理、語言與知識計算等專委會委員及《中文信息學報》編委,中國計算機學會中文信息處理專業(yè)委員會委員。

加入小米之前,他在中科院計算所、信工所從事自然語言處理和信息檢索相關的科研工作。在AICon 全球人工智能與機器學習大會現(xiàn)場,他將會帶來 NLP 技術方面的相關演講,各位感興趣的小伙伴歡迎來現(xiàn)場聽他分享。

AICon 全球人工智能與機器學習技術大會,將于 11 月 21-22 日在北京國際會議中心舉行。顏水成、賈揚清、崔寶秋等 AI 技術大咖屆時也會來現(xiàn)場,跟大家聊一聊今年在 AI 商業(yè)化場景落地的大背景下,又涌現(xiàn)出了哪些新技術。本次大會我們設立了機器學習、計算機視覺、NLP、AI芯片、搜索推薦、產業(yè)互聯(lián)網(wǎng)、硅谷 AI 技術實踐等 13+ 技術專場,細分到 AI 技術的各個領域,為大家全方位的展示 AI 技術在國內目前發(fā)展的現(xiàn)狀。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1813

    文章

    49708

    瀏覽量

    261242
  • 計算機視覺
    +關注

    關注

    9

    文章

    1714

    瀏覽量

    47443
  • nlp
    nlp
    +關注

    關注

    1

    文章

    491

    瀏覽量

    23182

原文標題:為何NLP領域難以出現(xiàn)“獨角獸”?丨AICon

文章出處:【微信號:infoqchina,微信公眾號:InfoQ】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    硬件SPI兩個CS操作兩個norflash,怎么互斥操作兩個norflash?

    硬件SPI兩個CS操作兩個norflash,怎么互斥操作兩個norflash,有一norflash被模擬成U盤,會在中斷中操作spi。
    發(fā)表于 09-26 06:18

    基本半導體連獲兩個行業(yè)獎項

    近日,基本半導體憑借在碳化硅模塊領域的突出表現(xiàn),連獲“國產SiC模塊TOP企業(yè)獎”和“年度優(yōu)秀功率器件產品獎”兩個行業(yè)獎項。
    的頭像 發(fā)表于 09-05 16:31 ?866次閱讀

    如何使用 SPI 全雙工在兩個 5LP MPU 之間連接 RAM?

    我需要將兩個 5LP MPU 連接在一起以鏡像兩個 5LP MPU 內的 RAM。 我認為這將是 DMA 的一功能,但我不確定如何實現(xiàn)該功能。 我的主 SPI 單元將向從屬 MPU 發(fā)送一
    發(fā)表于 07-15 06:20

    圖中兩個按鍵開關是兩個干簧管,為什么不直接對GND設計來檢測這個干簧管通斷呢?

    圖中兩個按鍵開關是兩個干簧管,為什么不直接對GND設計來檢測這個干簧管通斷呢? 這樣設計的原理是什么?
    發(fā)表于 06-17 06:30

    看到STM8L152用兩個IO用兩個或非門檢測兩個通斷,是什么原理呢?

    圖中兩個按鍵開關是兩個干簧管,為什么不直接對GND設計來檢測這個干簧管通斷呢? 這樣設計的原理是什么?
    發(fā)表于 06-12 06:25

    可以驅動兩個直流有刷電機、一雙極步進電機的雙H橋電機驅動芯片-SS8833E

    電機驅動芯片 - SS8833E是一種雙橋電機驅動器,具有兩個H橋驅動器,可以驅動兩個直流有刷電機、一雙極步進電機、電磁閥或其他電感負載。
    的頭像 發(fā)表于 02-12 09:43 ?903次閱讀
    可以驅動<b class='flag-5'>兩個</b>直流有刷電機、一<b class='flag-5'>個</b>雙極步進電機的雙H橋電機驅動芯片-SS8833E

    兩個不同頻率晶振靠的近會怎樣

    晶振的振蕩本質上是一種機械振動(在壓電晶體層面)。當兩個晶振靠得很近時,它們的機械振動可能會相互影響。一晶振的振動可能會通過電路板或者外殼等介質傳遞給另一晶振,從而改變另一晶振的
    的頭像 發(fā)表于 01-20 13:55 ?2011次閱讀
    <b class='flag-5'>兩個</b>不同頻率晶振靠的近會怎樣

    求助,以下兩個ADC轉換的通道,分別是CC2541上的哪兩個引腳???

    #define HAL_ADC_CHN_TEMP 0x0e /* Temperature sensor */ #define HAL_ADC_CHN_VDD3 0x0f /* VDD/3 */ 以上兩個ADC轉換的通道,分別是CC2541上的哪兩個引腳???
    發(fā)表于 01-14 08:15

    如何把兩個數(shù)據(jù)返回給調用函數(shù)

    函數(shù)的處理結果包含兩個數(shù)據(jù),如何把兩個數(shù)據(jù)返回給調用函數(shù)? 第一種,把兩個數(shù)據(jù)封裝成一結構體,函數(shù)返回結構體。 調用函數(shù)的地方同樣用結構體去接收函數(shù)的返回值。 第二種,把返回值保存在
    的頭像 發(fā)表于 01-08 10:15 ?667次閱讀

    ADS7230有兩個電源和兩個地,是不是意味著芯片內部模擬部分和數(shù)字部分是隔離的?

    ADS7230有兩個電源和兩個地,是不是意味著芯片內部模擬部分和數(shù)字部分是隔離的?或者是非隔離,只做電平轉換的?忘各位大俠解答,小弟不甚感激?。。?
    發(fā)表于 01-08 08:21

    兩個晶體管能如何實現(xiàn)高效正弦波振蕩?

    在電子設計中,振蕩器是一重要的組件,廣泛應用于信號發(fā)生、無線通信和音頻設備中。一般來說,設計一穩(wěn)定的正弦波振蕩器往往需要運算放大器或復雜的電路結構。然而,是否可以僅用兩個晶體管就輕松實現(xiàn)一
    的頭像 發(fā)表于 01-07 12:00 ?931次閱讀
    <b class='flag-5'>兩個</b>晶體管能如何實現(xiàn)高效正弦波振蕩?

    ADC124S021同時使用兩個通道,兩個通道的轉換數(shù)據(jù)發(fā)生串擾怎么解決?

    用DSP的SPI接口接ADC124S021,如果只是進行單通道的信號采集,則轉換后的數(shù)值穩(wěn)定,但是同時使用兩個通道時則兩個通道的數(shù)據(jù)發(fā)生串擾現(xiàn)象。如,我單獨使用2通道,則轉換后數(shù)值穩(wěn)定,但是如果
    發(fā)表于 12-30 07:41

    DAC8760的Iout和Vout都有兩個TVS防護,這兩個各是什么作用?

    1、DAC8760的Iout和Vout都有兩個TVS防護,這兩個各是什么作用? 2、如果我只希望DAC8760輸出0-5V和4-20mA,輸出電路的兩個TVS都要加么?
    發(fā)表于 12-30 06:49

    使用TPS546C23兩個獨立的單相評估模塊

    電子發(fā)燒友網(wǎng)站提供《使用TPS546C23兩個獨立的單相評估模塊.pdf》資料免費下載
    發(fā)表于 12-07 14:08 ?0次下載
    使用TPS546C23<b class='flag-5'>兩個</b>獨立的單相評估模塊

    ads1013有兩個模擬輸入,可以接不同的兩個模擬輸入嗎?

    ads1013有兩個模擬輸入,可以接不同的兩個模擬輸入嗎,驅動程序中怎么分別讀兩個模擬輸入的轉換結果?
    發(fā)表于 12-02 08:02