chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

<span id="r0m83"></span>
<bdo id="r0m83"><span id="r0m83"><meter id="r0m83"></meter></span></bdo>

<i id="r0m83"></i>
0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

語(yǔ)音是第三次交互革命,自然語(yǔ)言處理技術(shù)的發(fā)展和行業(yè)應(yīng)用

DPVg_AI_era ? 來(lái)源:未知 ? 作者:李倩 ? 2018-04-24 16:52 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

4月19日,清華大學(xué)《人工智能前沿與產(chǎn)業(yè)趨勢(shì)》系列課程第三講開(kāi)課,本講主題是“自然語(yǔ)言處理技術(shù)的發(fā)展和行業(yè)應(yīng)用”。自然語(yǔ)言處理(NLP)被認(rèn)為是人工智能研究中最為困難,也是最重要的問(wèn)題之一,不僅基礎(chǔ)研究難,技術(shù)落地和應(yīng)用場(chǎng)景也很復(fù)雜。本課由百度度秘事業(yè)部總經(jīng)理景鯤主講。新智元作為獨(dú)家合作媒體,帶來(lái)干貨整理。

主講老師

雷鳴

天使投資人

百度創(chuàng)始七劍客之一

酷我音樂(lè)創(chuàng)始人

清華大學(xué)海峽研究院大數(shù)據(jù) AI 中心 專(zhuān)家委員

特邀講者

景鯤

百度度秘事業(yè)部總經(jīng)理

景鯤 2014 年加入百度,就職于大搜索任總產(chǎn)品架構(gòu)師,負(fù)責(zé)百度大搜索整體產(chǎn)品規(guī)劃、創(chuàng)新與落地推進(jìn)。帶領(lǐng)團(tuán)隊(duì)大刀闊斧的創(chuàng)新整體搜索體驗(yàn),為數(shù)以?xún)|計(jì)的用戶(hù)提供平等便捷的搜索服務(wù)。同時(shí)與團(tuán)隊(duì)一起開(kāi)創(chuàng)式的引入了語(yǔ)音搜索、圖像搜索、對(duì)話(huà)式搜索等創(chuàng)新搜索交互方式。構(gòu)思和推動(dòng)了人工智能機(jī)器人助理度秘整體業(yè)務(wù)從想法、落地,到取得國(guó)際領(lǐng)先的優(yōu)勢(shì),推動(dòng)了整個(gè)業(yè)界對(duì)智能對(duì)話(huà)領(lǐng)域的認(rèn)知。2016 年 10 月,全面接手度秘團(tuán)隊(duì)的管理工作。促成度秘與國(guó)安廣視、小魚(yú)在家等多個(gè)廠(chǎng)商的戰(zhàn)略合作,開(kāi)拓了軟硬結(jié)合的新產(chǎn)品形態(tài)。并在 17 年,帶領(lǐng)團(tuán)隊(duì)在美國(guó)拉斯維加斯 CES 上正式推出了對(duì)話(huà)式人工智能操作系統(tǒng) DuerOS。

景鯤加入百度之前,曾任微軟公司首席研發(fā)總監(jiān)并負(fù)責(zé)微軟必應(yīng)搜索在亞洲市場(chǎng)的研發(fā)工作,也是微軟小冰的創(chuàng)造者。

4月19日,清華大學(xué)《人工智能前沿與產(chǎn)業(yè)趨勢(shì)》系列課程第三講開(kāi)課,本講主題是“自然語(yǔ)言處理技術(shù)的發(fā)展和行業(yè)應(yīng)用”。自然語(yǔ)言處理(NLP)被認(rèn)為是人工智能研究中最為困難,也是最重要的問(wèn)題之一。本課由百度度秘事業(yè)部總經(jīng)理景鯤主講。在講座之前,雷鳴老師就音頻和NLP技術(shù)作了總覽式的概述:

NLP技術(shù)現(xiàn)在能看到一些落地,特別大的一個(gè)場(chǎng)景就是助理,包括家庭助理、虛擬助理、車(chē)內(nèi)的語(yǔ)音助理、兒童語(yǔ)言交互機(jī)器人等。第二個(gè)場(chǎng)景時(shí)智能客服系統(tǒng);第三是語(yǔ)言翻譯。

景鯤:語(yǔ)音是第三次交互革命

景鯤:大家好,我叫景鯤,我來(lái)自百度,百度度秘事業(yè)部。我加入百度大概四年時(shí)間,負(fù)責(zé)對(duì)話(huà)式人工智能的產(chǎn)品的落地。加入百度之前我在微軟工作了八年時(shí)間,負(fù)責(zé)必應(yīng)搜索引擎和微軟小冰項(xiàng)目。所以直接跟NLP以及NLP的業(yè)務(wù)落地有一段時(shí)間的經(jīng)驗(yàn)了。然后也給大家介紹一下百度度秘。

整個(gè)百度的業(yè)務(wù)主要分成兩塊,一塊是我們?cè)谝苿?dòng)市場(chǎng)上做的一些業(yè)務(wù),比如搜索,愛(ài)奇藝,手機(jī)百度的feed流等;另一塊就是我們面向人工智能時(shí)代興起,用人工智能來(lái)驅(qū)動(dòng)的新的業(yè)務(wù),這個(gè)業(yè)務(wù)包括無(wú)人車(chē)。第二個(gè)就是人機(jī)交互,我們做了百度度秘。我們?cè)?AI 時(shí)代落地的兩大主要業(yè)務(wù)平臺(tái),一個(gè)是無(wú)人車(chē)的阿波羅,一個(gè)是度秘。

百度為什么把度秘作為這么重要的一個(gè)戰(zhàn)略業(yè)務(wù)來(lái)做?其實(shí)它是一個(gè)非常大的業(yè)務(wù)。回望我剛開(kāi)始學(xué)計(jì)算機(jī)的時(shí)候,那個(gè)時(shí)候還是用鼠標(biāo)和鍵盤(pán),鍵盤(pán)是用五筆輸入法。然后那個(gè)時(shí)候用五筆輸入法還要去花錢(qián)上培訓(xùn)班學(xué)習(xí)五筆輸入法。后來(lái)可以用拼音輸入法了,一下門(mén)檻就降低了。 用拼音輸入法之后,很多人就可以跟計(jì)算機(jī)進(jìn)行交互,進(jìn)行交流了。隨著這種輸入的門(mén)檻的降低,用戶(hù)跟計(jì)算機(jī)之間的交互更方便了,更多的用戶(hù)得以接觸到計(jì)算機(jī)。所以鼠標(biāo)和鍵盤(pán)的交互就推動(dòng)了整個(gè)計(jì)算機(jī)的普及。

第二個(gè)階段也是由交互推動(dòng)整個(gè)科技的進(jìn)展,這次的交互是用手指觸屏的交互。通過(guò)手指觸摸手機(jī),讓更多的用戶(hù)能夠跟計(jì)算機(jī)進(jìn)行交流,所以在這個(gè)時(shí)候基本上已經(jīng)擺脫了語(yǔ)言的障礙。所以我們可以看到在中國(guó)市場(chǎng),移動(dòng)的互聯(lián)網(wǎng)用戶(hù)是遠(yuǎn)遠(yuǎn)大于 PC 時(shí)代的互聯(lián)網(wǎng)用戶(hù)的。

我們覺(jué)得在新的人工智能時(shí)代,新的交戶(hù)應(yīng)該是用更加自然的,用人類(lèi)的交互方式與計(jì)算機(jī)進(jìn)行交流,我們認(rèn)為這種溝通方式就是用語(yǔ)音、用對(duì)話(huà)。因?yàn)槲覀兠總€(gè)人可能兩歲的時(shí)候就開(kāi)始學(xué)說(shuō)話(huà),我們80歲的時(shí)候還是可以用語(yǔ)音交流。為什么語(yǔ)音交互可以成真?因?yàn)橛?jì)算機(jī)通過(guò)人工智能能力的賦能,通過(guò)深度學(xué)習(xí)等各種機(jī)器學(xué)習(xí)的方法,語(yǔ)音識(shí)別、圖像識(shí)別等能力開(kāi)始慢慢變得成熟,NLP的能力在某些領(lǐng)域也逐漸可以落地。 所以在人和機(jī)器交互過(guò)程中,機(jī)器開(kāi)始能夠嘗試聽(tīng)懂我們所說(shuō)的話(huà),語(yǔ)音交互開(kāi)始變得越來(lái)越popular。

大概在Siri出現(xiàn)、在 iPhone4 的時(shí)候,就有一大批公司在做語(yǔ)音交互方面的產(chǎn)品。那時(shí)候是高峰期,很多公司都在做,但迅速就到一個(gè)下降期。用戶(hù)對(duì)語(yǔ)音助手開(kāi)始失望。但最近這兩年隨著Echo的出現(xiàn),大家發(fā)現(xiàn)語(yǔ)音助手找到了它的使用場(chǎng)景,它跟硬件結(jié)合之后,通過(guò)遠(yuǎn)場(chǎng)交互的語(yǔ)音能夠讓我們跟機(jī)器進(jìn)行交流,所以這個(gè)市場(chǎng)又蓬勃而起。

為什么百度這么重視這件事情?因?yàn)槊恳淮蔚目萍嫉倪M(jìn)步,大的進(jìn)步,基本上都是由交互來(lái)驅(qū)動(dòng)的。從最開(kāi)始在鼠標(biāo)鍵盤(pán)時(shí)代,世界上最大的公司是微軟。微軟當(dāng)時(shí)基本上只做了一個(gè)體驗(yàn),就是鼠標(biāo)和鍵盤(pán)的體驗(yàn),把它做到了最優(yōu)。移動(dòng)時(shí)代又出現(xiàn)另外一家偉大的公司,就是現(xiàn)在市值最高的一家公司蘋(píng)果,把這種交互做對(duì)了。所以它推動(dòng)了整個(gè)移動(dòng)智能社會(huì)的前進(jìn),開(kāi)拓了難以想象的巨大的科技市場(chǎng)。

我們覺(jué)得在新的時(shí)代通過(guò)自然語(yǔ)言對(duì)話(huà),我們有機(jī)會(huì)跟每一個(gè)計(jì)算機(jī)、每個(gè)手機(jī)、每個(gè)桌子甚至每個(gè)椅子去對(duì)話(huà),在我們需要的時(shí)候我們就跟它對(duì)話(huà),在新的場(chǎng)景里面去對(duì)話(huà),這樣的市場(chǎng)將會(huì)比原來(lái)市場(chǎng)大得多。每個(gè)人與搜索引擎去互動(dòng),或者跟互聯(lián)網(wǎng)去交流,獲取信息服務(wù),都是一種更加便捷的交互。所以第三次交互的革命將會(huì)引發(fā)非常多創(chuàng)新。

我們看一下一些研究機(jī)構(gòu)做的市場(chǎng)分析。這是IDC做的中國(guó)市場(chǎng)對(duì)話(huà)式人工智能的市場(chǎng)分析。報(bào)告顯示,到2020年,27%的智能家居產(chǎn)品都會(huì)變成語(yǔ)音可以互動(dòng)的。從現(xiàn)在的市場(chǎng)來(lái)看,基本上語(yǔ)音交互的產(chǎn)品已經(jīng)逐漸變成標(biāo)準(zhǔn)配置,所以到 2020 年的時(shí)候,大概有 27% 的家具可以互動(dòng),不只是電視,冰箱、空調(diào)、洗衣機(jī),甚至連豆?jié){機(jī),我們的合作伙伴都希望用戶(hù)能它說(shuō)話(huà)。所以智能家具的市場(chǎng)還是很大。

第二個(gè)市場(chǎng)就是車(chē)載市場(chǎng)。因?yàn)檐?chē)本身就是雙手被固定在方向盤(pán)上的一個(gè)場(chǎng)景,用戶(hù)的一個(gè)很自然的需求,就是通過(guò)跟車(chē)的交互去獲取車(chē)上的信息和服務(wù)。這個(gè)時(shí)候最自然的一種交互就是語(yǔ)音交互。所以從今年開(kāi)始大家也可以看到在一些新車(chē)上,尤其是以互聯(lián)網(wǎng)汽車(chē)為標(biāo)簽的新車(chē)上,語(yǔ)音交互已經(jīng)成為了標(biāo)準(zhǔn)配置。

還有就是手機(jī)和可穿戴設(shè)備。我們平臺(tái)上現(xiàn)在最活躍的一個(gè)設(shè)備是手表,比如兒童手表。每年在中國(guó)能賣(mài)大概上千萬(wàn)的智能手表,但是在中國(guó)這種手表主要是消費(fèi)給了兒童群體,在這個(gè)群體里面用語(yǔ)音交互就是最自然的一種交互。預(yù)期到2020年,手機(jī)和可穿戴設(shè)備大概能達(dá)到 68%。

回顧一下原來(lái)的手機(jī)市場(chǎng),當(dāng) IOS 推出之后,大家都發(fā)現(xiàn)手指觸摸這種體驗(yàn)太好了。但是在安卓系統(tǒng)開(kāi)放之前,一個(gè)廠(chǎng)商大概要花幾千萬(wàn)美金,可能才能研發(fā)一款手機(jī)。但是有了安卓之前,這些廠(chǎng)商投入的資本可能是1/10的原來(lái)的投入,所以迅速讓智能設(shè)備、智能手機(jī)變得滿(mǎn)地開(kāi)花,數(shù)量和接觸人群都在指數(shù)級(jí)的增長(zhǎng)。語(yǔ)音交互也一樣,并不是每家公司都能夠從頭做語(yǔ)音識(shí)別、語(yǔ)音合成、語(yǔ)義理解,甚至資源的檢索。這個(gè)時(shí)候百度其實(shí)非常有意愿提供語(yǔ)音交互時(shí)代的一個(gè)底層的操作系統(tǒng),能夠賦能這樣的智能設(shè)備,讓它變成語(yǔ)音交互。

要把語(yǔ)音交互做對(duì)的話(huà),有三點(diǎn)要做對(duì):第一是聽(tīng)得清,第二是聽(tīng)得懂,第三是滿(mǎn)足得好。

聽(tīng)得清,就是把語(yǔ)音識(shí)別成文字的過(guò)程。第二,聽(tīng)得懂是真正能夠理解文字,能夠消化,知道用戶(hù)的意圖。第三,滿(mǎn)足。知道用戶(hù)的意圖之后,還能把合適的內(nèi)容和服務(wù)傳遞給用戶(hù)。所以這三步缺一不可。

第一步很多的公司都在解決,而且聽(tīng)清的問(wèn)題已經(jīng)逐漸被解決。雖然中國(guó)還存在著一些地方的口音,但是語(yǔ)音識(shí)別的能力基本上是逐漸增強(qiáng),可以預(yù)見(jiàn),在未來(lái)的一兩年內(nèi),語(yǔ)音識(shí)別,聽(tīng)清的這部分可以做得很好。但是在有些固定場(chǎng)景里面,還需要特定的優(yōu)化。

第二方面是最難的,就是聽(tīng)的懂。聽(tīng)懂其實(shí)是很高的要求,不只要知道它的字面意思,比如我們?cè)诎俣人阉魃衔覀兘?jīng)??吹接脩?hù)查詢(xún)北京天氣,可能就有一百種以上的說(shuō)法,用戶(hù)會(huì)說(shuō)“北京天氣”,也會(huì)說(shuō)“北京明天下雨嗎”,也會(huì)說(shuō)“北京明天刮風(fēng)嗎”,“北京明天有霧霾嗎”,這些都是跟天氣相關(guān)的需求。怎么樣做到聽(tīng)懂是人工智能交互中最核心的能力,誰(shuí)能把聽(tīng)得懂做好,就能真正攻克人工智能的難關(guān)。

第三方面就是滿(mǎn)足。用戶(hù)在與一個(gè)設(shè)備語(yǔ)音對(duì)話(huà)的時(shí)候,往往會(huì)有非常多樣的需求,真正能夠把需求理解好,并且把資源索引到,這也是百度可以做的優(yōu)勢(shì),并且可以為我們的用戶(hù)和合作伙伴去提供的能力。

在Echo出現(xiàn)之前,大家其實(shí)比較聚焦的聽(tīng)清的能力是在手機(jī)上的近場(chǎng)語(yǔ)音交互。比如說(shuō)我們按一個(gè)按鈕,比如像微信,去解決這種語(yǔ)音識(shí)別的能力。但是隨著智能硬件出現(xiàn),就出現(xiàn)了新的場(chǎng)景的語(yǔ)音交互。比如說(shuō)在一些廣闊空間、車(chē)載、吵雜環(huán)境里面開(kāi)始出現(xiàn)了麥克風(fēng)陣列。簡(jiǎn)單解釋一下,麥克風(fēng)陣列由兩個(gè)及以上麥克風(fēng)組成的一個(gè)陣列,它可以進(jìn)行回聲消除。屋子里面多個(gè)麥克風(fēng)陣列,通過(guò)不同的麥克風(fēng)接收到聲音信號(hào)的強(qiáng)弱,通過(guò)接觸到不同的聲音的時(shí)間,來(lái)消除掉回聲。在沒(méi)有這個(gè)技術(shù)之前,大家可能會(huì)覺(jué)得不是一個(gè)特別的難的問(wèn)題,但其實(shí)這是對(duì)計(jì)算機(jī)是一個(gè)非常難的問(wèn)題。因?yàn)樵谶@樣的屋子里面,尤其在這樣密閉的空間里面,回聲讓計(jì)算機(jī)聽(tīng)起來(lái)是多個(gè)聲波的疊加。多個(gè)聲波疊加之后計(jì)算機(jī)就分不清哪些是原聲,哪些是回聲。

有時(shí)候我們跟人說(shuō)話(huà),面對(duì)面的時(shí)候聽(tīng)得很清楚,但換一個(gè)位置就可能聽(tīng)不清了,這是因?yàn)槲覀兊亩溆兄赶蛐?。通常正面?duì)著一個(gè)人的時(shí)候,收音最好。對(duì)計(jì)算機(jī)也是一樣,有陣列之后往往需要一個(gè)解決的問(wèn)題,就是通過(guò)陣列能夠辨別發(fā)音的方向是哪個(gè)方向。我們一旦定位發(fā)音的方向之后,這個(gè)方向的語(yǔ)音識(shí)別就會(huì)做得更好,這也是通過(guò)多麥克陣列來(lái)達(dá)到的效果。

還有語(yǔ)音喚醒。語(yǔ)音喚醒指現(xiàn)在的計(jì)算機(jī)麥克風(fēng)不能時(shí)刻收音,以教室為例,旁邊的機(jī)器聲,甚至窗戶(hù)聲會(huì)有很多聲音雜音進(jìn)來(lái),讓計(jì)算機(jī)到搞得很亂。語(yǔ)音喚醒是指,通過(guò)一個(gè)特定的喚醒詞,說(shuō)了這個(gè)詞之后,機(jī)器開(kāi)始響應(yīng),開(kāi)始聽(tīng)我們的聲音。所以語(yǔ)音喚醒相當(dāng)于人和機(jī)器之間進(jìn)行了一個(gè)初次的連接。

還有遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別。遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別是在智能硬件出現(xiàn)之前應(yīng)用的不太多的一個(gè)技術(shù),但隨著像智能音箱這樣的設(shè)備的出現(xiàn),用戶(hù)往往跟它的交互式在一米開(kāi)外的,這個(gè)時(shí)候的語(yǔ)音識(shí)別跟近場(chǎng)手機(jī)上的語(yǔ)音識(shí)別有很大的不一樣。所以在智能硬件這個(gè)領(lǐng)域,讓一個(gè)設(shè)備真的可以聽(tīng)清我們說(shuō)話(huà)需要做的新的技術(shù)儲(chǔ)備。

第二個(gè)方面就是聽(tīng)懂。沒(méi)有大數(shù)據(jù)沒(méi)有算法是很難做好聽(tīng)懂的。我用了一個(gè)詞叫“freestyle”,用戶(hù)在跟機(jī)器溝通過(guò)程中,其實(shí)他的表達(dá)是非常重要的。舉個(gè)例子,這個(gè)詞語(yǔ)音識(shí)別是“在家為是”,這是我們有一個(gè)電視機(jī)頂盒在湖南落地的時(shí)候,湖南的一些用戶(hù)檢索的日志,然后我們脫敏之后,發(fā)現(xiàn)“在家為是”就是“浙江衛(wèi)視”。所以看語(yǔ)音的時(shí)候其實(shí)不懂他是什么意思,要真的懂的話(huà),你需要加上地方語(yǔ)音識(shí)別的模型,再加上我們?cè)谒阉饕婵吹接脩?hù)的搜索數(shù)據(jù)采集的信號(hào),結(jié)合在一起才能真正了解這個(gè)是什么意思。所以用戶(hù)在跟計(jì)算機(jī)語(yǔ)音交互過(guò)程中,要解決聽(tīng)懂的問(wèn)題。

聽(tīng)清慢慢能夠被解決,但是誰(shuí)能解決聽(tīng)懂誰(shuí),誰(shuí)就基本上跨過(guò)了人機(jī)交互的一個(gè)非常重要的門(mén)檻。要解決聽(tīng)懂的方式,就是要通過(guò)大數(shù)據(jù)、通過(guò)深度學(xué)習(xí)算法不停地計(jì)算,才能知道用戶(hù)真正表達(dá)的語(yǔ)意是什么。

第三個(gè)就是滿(mǎn)足。解決了交互之后,用戶(hù)就會(huì)忽略交互。iPhone 一代出現(xiàn)的時(shí)候,大家會(huì)覺(jué)得用手指去按整個(gè)的屏幕是一個(gè)特別爽的交互,但是隨著智能手機(jī)逐漸普及之后,用戶(hù)覺(jué)得說(shuō)用手按屏幕就是一個(gè)很正常的交互,忘記了交互。忘記交互之后,用戶(hù)就開(kāi)始真正關(guān)心里面的服務(wù)和內(nèi)容。所以當(dāng)有些用戶(hù)跟智能音箱去交互的時(shí)候,他們需要的是音樂(lè),是信息,或者是聊天等等各種各樣的信息的服務(wù),這些服務(wù)正好跟百度所擁有的信息和服務(wù)的資源是特別吻合的,所以我們也把這些數(shù)據(jù)開(kāi)放出來(lái),跟我們的合作伙伴,通過(guò)他們的語(yǔ)音交互去直接獲取這些信息和服務(wù)。

然后透露一個(gè)數(shù)據(jù),截止到今年的 1 月份,百度DUEROS 的平臺(tái)上搭載了激活的設(shè)備數(shù),累計(jì)已經(jīng)超過(guò)了 5000 萬(wàn)臺(tái),相當(dāng)于是 5000 萬(wàn)的手機(jī)、音箱、電視、手表等各種設(shè)備都具有了語(yǔ)音識(shí)別的能力。每個(gè)月的活躍設(shè)備超過(guò)1000 萬(wàn)。這個(gè)數(shù)字還在不停的增長(zhǎng),基本上每年我們可能接觸的語(yǔ)音智能設(shè)備都會(huì)翻倍增加。2020 年的時(shí)候,智能設(shè)備可能會(huì)真正走到我們每個(gè)人的家庭里面。

我們的合作伙伴也很多,這里舉幾個(gè)例子,比如說(shuō)海爾、VIVO、TCL、小米等等,這些公司本來(lái)跟百度的關(guān)系其實(shí)是沒(méi)有那么近的。他們都是硬件公司,百度做的是互聯(lián)網(wǎng)搜索,本來(lái)感覺(jué)兩個(gè)行業(yè)并沒(méi)有太多的交集。但是當(dāng)我們做的這種喚醒萬(wàn)物,讓每個(gè)智能設(shè)備都可以語(yǔ)音對(duì)話(huà)之后,我們的交易就很多了。很多的智能家居的合作伙伴都在把這樣的能力植入到他的設(shè)備里面去,讓設(shè)備具有可以語(yǔ)音交互的能力。

同時(shí)落地的設(shè)備也非常多,從音箱到投影儀到機(jī)器人、電視,會(huì)非常多。還有,它催發(fā)了第三個(gè)開(kāi)發(fā)者生態(tài)。開(kāi)發(fā)者生態(tài)是什么?大家知道在PC時(shí)代,有一個(gè)非常龐大的開(kāi)發(fā)者生態(tài),是做應(yīng)用程序 exe。在移動(dòng)時(shí)代也有一個(gè)非常強(qiáng)大的開(kāi)發(fā)者生態(tài),是做 APP 的開(kāi)發(fā)者。每一次一個(gè)交互的開(kāi)啟,基本上代表著有一類(lèi)新的開(kāi)發(fā)者也會(huì)隨著這個(gè)平臺(tái)去成長(zhǎng)。所以現(xiàn)在在語(yǔ)音交互的平臺(tái)上,已經(jīng)超過(guò)了一萬(wàn)多個(gè)開(kāi)發(fā)者跟我們一起合作。同時(shí)用戶(hù)用這種語(yǔ)音交互累計(jì)回答的問(wèn)題已經(jīng)超過(guò)了24億個(gè)。

這里舉幾個(gè)例子,現(xiàn)在都有什么樣的語(yǔ)音交互設(shè)備,NLP和語(yǔ)音識(shí)別都應(yīng)用在什么樣的產(chǎn)品上?比如說(shuō)早晨的時(shí)候會(huì)用在智能音箱上,很多人早晨起床的時(shí)候會(huì)問(wèn)一下天氣,問(wèn)一下路況。還有在路上的設(shè)備,有車(chē)載顯示屏、耳機(jī)等。還有一些機(jī)器人和其他設(shè)備。

在人工智能時(shí)代,軟件+硬件是深度結(jié)合的趨勢(shì)。原來(lái)我們做語(yǔ)音識(shí)別的時(shí)候,很多時(shí)候是在手機(jī)上做。原來(lái)微軟的觸摸,比如Windows8,是在筆記本上可以觸摸的。但后來(lái)發(fā)現(xiàn)雖然觸摸交互是對(duì)的,但是你放到一個(gè)不同的設(shè)備上,感覺(jué)就不對(duì)。很少有人用手指去觸摸屏幕。在語(yǔ)音上也是,比如說(shuō)手機(jī)是一個(gè)觸摸為主的設(shè)備,我們?cè)瓉?lái)做語(yǔ)音助手的時(shí)候,很多是把語(yǔ)音能力嫁接在手機(jī)上,其實(shí)用戶(hù)用手機(jī)去進(jìn)行語(yǔ)音交互的時(shí)候,反而沒(méi)有觸摸來(lái)的快。所以語(yǔ)音更好應(yīng)用的場(chǎng)景在哪里?更好是在新的 AI智能硬件上。

百度也做了幾款智能音箱的嘗試,包括raven H和小度在家。除了中國(guó)市場(chǎng)在做對(duì)話(huà)式人工智能的落地,涉及到語(yǔ)音識(shí)別,語(yǔ)義理解交互和內(nèi)容,國(guó)際的巨頭也在布局市場(chǎng),亞馬遜,谷歌蘋(píng)果微軟都投入重兵。人工智能終將走近大家的身邊,走進(jìn)尋常百姓家,在生活中有工作的用武之地。

對(duì)話(huà)環(huán)節(jié)

清華大學(xué)海峽研究院大數(shù)據(jù) AI 中心專(zhuān)家委員雷鳴,百度度秘事業(yè)部總經(jīng)理景鯤,清華大學(xué)智能技術(shù)與系統(tǒng)國(guó)家重點(diǎn)實(shí)驗(yàn)室主任朱小燕,梅花創(chuàng)投創(chuàng)始合伙人吳世春就NLP在現(xiàn)在和未來(lái)的挑戰(zhàn),深度學(xué)習(xí)、機(jī)器學(xué)習(xí)在NLP中扮演的角色,NLP技術(shù)發(fā)展落地以及投資等方面的問(wèn)題,進(jìn)行了精彩對(duì)話(huà)。雷鳴認(rèn)為,人工智能到明年開(kāi)始逐漸落地,生根發(fā)芽,這是解決實(shí)際問(wèn)題的一個(gè)過(guò)程,在產(chǎn)品落地的過(guò)程中,這個(gè)市場(chǎng)有特別多的機(jī)會(huì)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 百度
    +關(guān)注

    關(guān)注

    9

    文章

    2379

    瀏覽量

    95052
  • 人工智能
    +關(guān)注

    關(guān)注

    1819

    文章

    50160

    瀏覽量

    265989
  • 自然語(yǔ)言
    +關(guān)注

    關(guān)注

    1

    文章

    292

    瀏覽量

    14016

原文標(biāo)題:【清華AI公開(kāi)課】景鯤:百度為什么重視語(yǔ)音?

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    自然語(yǔ)言處理NLP的概念和工作原理

    自然語(yǔ)言處理 (NLP) 是人工智能 (AI) 的一個(gè)分支,它會(huì)教計(jì)算機(jī)如何理解口頭和書(shū)面形式的人類(lèi)語(yǔ)言。自然語(yǔ)言處理將計(jì)算
    的頭像 發(fā)表于 01-29 14:01 ?469次閱讀
    <b class='flag-5'>自然語(yǔ)言</b><b class='flag-5'>處理</b>NLP的概念和工作原理

    2025年度深圳市集成電路產(chǎn)業(yè)總結(jié)大會(huì)暨深圳市半導(dǎo)體行業(yè)協(xié)會(huì)第八屆第三次會(huì)員大會(huì)圓滿(mǎn)舉辦

    2026年1月16日,2025年度深圳市集成電路產(chǎn)業(yè)總結(jié)大會(huì)暨深圳市半導(dǎo)體行業(yè)協(xié)會(huì)第八屆第三次會(huì)員大會(huì)在南山區(qū)科興國(guó)際會(huì)議中心隆重舉辦。來(lái)自政府主管部門(mén)、會(huì)員企業(yè)、科研機(jī)構(gòu)、投資機(jī)構(gòu)及行業(yè)
    的頭像 發(fā)表于 01-18 13:00 ?1113次閱讀
    2025年度深圳市集成電路產(chǎn)業(yè)總結(jié)大會(huì)暨深圳市半導(dǎo)體<b class='flag-5'>行業(yè)</b>協(xié)會(huì)第八屆<b class='flag-5'>第三次</b>會(huì)員大會(huì)圓滿(mǎn)舉辦

    國(guó)芯科技以3000萬(wàn)元第三次增資龍擎視芯

    近日,國(guó)芯科技以3000萬(wàn)元參與蘇州龍擎視芯集成電路有限公司(以下簡(jiǎn)稱(chēng)“龍擎視芯”)Pre-A輪融資。這是繼天使輪、天使+輪后,國(guó)芯科技第三次增資龍擎視芯。本輪融資完成后,國(guó)芯科技合計(jì)持有龍擎視芯8.97%的股權(quán),成為龍擎視芯除團(tuán)隊(duì)外的外部第一大股東。
    的頭像 發(fā)表于 12-15 11:44 ?987次閱讀

    TCP的三次握手

    ,Server進(jìn)入SYN_RCVD狀態(tài)。 (3)第三次握手:Client收到確認(rèn)后,檢查ack是否為J+1,ACK是否為1,如果正確則將標(biāo)志位ACK置為1,ack=K+1,并將該數(shù)據(jù)包發(fā)送給Server
    發(fā)表于 12-02 07:16

    端到端語(yǔ)音交互革命:百度智能云聯(lián)合地瓜機(jī)器人,重塑AI陪伴體驗(yàn)

    電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)隨著大模型技術(shù)的迅猛發(fā)展,人機(jī)交互正經(jīng)歷從“工具式響應(yīng)”向“擬人化陪伴”的深刻變革。在這一進(jìn)程中,語(yǔ)音交互作為
    發(fā)表于 12-01 01:07 ?1785次閱讀
    端到端<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b><b class='flag-5'>革命</b>:百度智能云聯(lián)合地瓜機(jī)器人,重塑AI陪伴體驗(yàn)

    從電網(wǎng)到柵極:賦能第三次能源革命

    開(kāi)啟。隨后在美國(guó)發(fā)生了第二能源革命,20 世紀(jì)石油產(chǎn)業(yè)的繁榮推動(dòng)了汽車(chē)和電力領(lǐng)域取得前所未有的進(jìn)步。 如今,人工智能 (AI) 的快速發(fā)展正在引領(lǐng)第三次能源
    的頭像 發(fā)表于 11-14 10:19 ?657次閱讀
    從電網(wǎng)到柵極:賦能<b class='flag-5'>第三次</b>能源<b class='flag-5'>革命</b>

    云知聲論文入選自然語(yǔ)言處理頂會(huì)EMNLP 2025

    近日,自然語(yǔ)言處理(NLP)領(lǐng)域國(guó)際權(quán)威會(huì)議 ——2025 年計(jì)算語(yǔ)言學(xué)與自然語(yǔ)言處理國(guó)際會(huì)議(EMNLP 2025)公布論文錄用結(jié)果,云知
    的頭像 發(fā)表于 11-10 17:30 ?839次閱讀
    云知聲論文入選<b class='flag-5'>自然語(yǔ)言</b><b class='flag-5'>處理</b>頂會(huì)EMNLP 2025

    大模型驅(qū)動(dòng)下的人機(jī)交互革命,“超擬真人互動(dòng)”?讓玩具讀懂你的情緒

    ,全方位重構(gòu)了智能硬件的人機(jī)交互范式,為行業(yè)提供了從技術(shù)底層到商業(yè)應(yīng)用的完整路徑。 ? 從人機(jī)交互技術(shù)演進(jìn)邏輯來(lái)看,經(jīng)歷了文本
    的頭像 發(fā)表于 10-31 09:21 ?6494次閱讀
    大模型驅(qū)動(dòng)下的人機(jī)<b class='flag-5'>交互</b><b class='flag-5'>革命</b>,“超擬真人互動(dòng)”?讓玩具讀懂你的情緒

    集創(chuàng)北方出席LED TCON團(tuán)體標(biāo)準(zhǔn)發(fā)展第三次技術(shù)研討會(huì)

    近日,由中國(guó)光學(xué)光電子行業(yè)協(xié)會(huì)發(fā)光二極管顯示應(yīng)用分會(huì)(簡(jiǎn)稱(chēng)中國(guó)光協(xié)LED顯示應(yīng)用分會(huì))主辦,北京集創(chuàng)北方科技股份有限公司(簡(jiǎn)稱(chēng)集創(chuàng)北方)承辦的“《基于TCON方案的LED顯示接口及通訊協(xié)議規(guī)范》團(tuán)體標(biāo)準(zhǔn)第三次技術(shù)研討會(huì)”在集創(chuàng)北
    的頭像 發(fā)表于 08-16 16:19 ?1672次閱讀

    華為連續(xù)第三次入選Gartner?企業(yè)有線(xiàn)無(wú)線(xiàn)局域網(wǎng)基礎(chǔ)設(shè)施魔力象限領(lǐng)導(dǎo)者

    and Wireless LAN Infrastructure),華為連續(xù)第三次入選領(lǐng)導(dǎo)者象限,是入選該象限的唯一非北美廠(chǎng)商。 ? 華為入選2025年Gartner企業(yè)有線(xiàn)無(wú)線(xiàn)局域網(wǎng)基礎(chǔ)設(shè)施魔力象限領(lǐng)導(dǎo)者 AI時(shí)代
    的頭像 發(fā)表于 06-28 18:54 ?5712次閱讀

    安光電第一屆第三次化合物半導(dǎo)體技術(shù)研討會(huì)成功舉辦

    近日,由安學(xué)院主辦,人資中心、技術(shù)中心、總經(jīng)辦協(xié)辦的安光電第一屆第三次化合物半導(dǎo)體技術(shù)研討會(huì)在廈門(mén)香格里拉酒店隆重舉辦,邀請(qǐng)18位來(lái)自各
    的頭像 發(fā)表于 06-27 17:09 ?1049次閱讀

    舜宇車(chē)載光學(xué)召開(kāi)車(chē)載激光雷達(dá)團(tuán)體標(biāo)準(zhǔn)第三次會(huì)議

    近日,由舜宇車(chē)載光學(xué)牽頭的《車(chē)載激光雷達(dá)典型光學(xué)器件可靠性要求及檢測(cè)方法》團(tuán)體標(biāo)準(zhǔn)第三次工作組會(huì)議在浙江省余姚市召開(kāi)。
    的頭像 發(fā)表于 06-20 09:31 ?1085次閱讀

    明遠(yuǎn)智睿SSD2351開(kāi)發(fā)板:語(yǔ)音機(jī)器人領(lǐng)域的變革力量

    通過(guò)網(wǎng)絡(luò)連接云端服務(wù)器進(jìn)行快速檢索和分析,然后利用語(yǔ)音合成技術(shù)將答案以自然流暢的語(yǔ)音反饋給用戶(hù)。同時(shí),借助開(kāi)發(fā)板的網(wǎng)絡(luò)連接功能,語(yǔ)音機(jī)器人還
    發(fā)表于 05-28 11:36

    TCP三次握手和四揮手,這樣解釋太通俗易懂了!

    TCP連接的建立和釋放分別通過(guò)“三次握手”和“四揮手”來(lái)完成。三次握手過(guò)程TCP三次握手是建立可靠網(wǎng)絡(luò)連接的關(guān)鍵過(guò)程,它用于確保通信雙方能夠正常發(fā)送和接收數(shù)據(jù),并提供可靠的數(shù)據(jù)傳輸機(jī)
    的頭像 發(fā)表于 04-24 19:33 ?1610次閱讀
    TCP<b class='flag-5'>三次</b>握手和四<b class='flag-5'>次</b>揮手,這樣解釋太通俗易懂了!

    零知開(kāi)源——ESP32語(yǔ)音交互系統(tǒng)(AI小智)開(kāi)發(fā)教程

    小智AI聊天機(jī)器人是一個(gè)基于嵌入式硬件與人工智能技術(shù)深度融合的智能交互系統(tǒng)。該項(xiàng)目以ESP32開(kāi)發(fā)板為核心,結(jié)合語(yǔ)音喚醒、自然語(yǔ)言處理、音頻
    的頭像 發(fā)表于 03-29 15:33 ?1.3w次閱讀
    零知開(kāi)源——ESP32<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>系統(tǒng)(AI小智)開(kāi)發(fā)教程