chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI語音助手,助你開啟智能生活

電子那些事兒 ? 2018-11-15 18:22 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

11月7日,在烏鎮(zhèn)第五屆世界互聯(lián)網(wǎng)大會(huì)上,小米面向智能家居人工智能開放平臺(tái)(即小愛同學(xué))成功入選”世界互聯(lián)網(wǎng)領(lǐng)先科技成果”,恰好我這幾天也在學(xué)習(xí)AI語音助手相關(guān)的知識(shí),借此從時(shí)間維度談?wù)勎业囊稽c(diǎn)認(rèn)識(shí)。

一、AI語音助手的歷史大事記

2010年4月28日,蘋果公司完成了對Siri公司的收購,Siri從App Store中下架,并取消了所有除iOS平臺(tái)外的軟件研發(fā);2014年4月2日至4日,在美國加利福尼亞州舊金山舉行的微軟Build開發(fā)者大會(huì)上,微軟全球副總裁喬北峰首度向公眾展示了小娜;2014年11月,亞馬遜宣布將Alexa與Echo合并;2015年9月9日,百度董事長兼首席執(zhí)行官李彥宏在百度世界大會(huì)中推出度秘(Duer);2016年5月19日,Google在Google I/O大會(huì)上發(fā)布了Google Assistant;2017年7月26日,小米發(fā)布的首款人工智能(AI)音箱的喚醒詞及二次元人物形象小愛同學(xué);2018年5月9日,Google在Google I/O大會(huì)上發(fā)布了Google Duplex;2018年8月15日,亞馬遜和微軟聯(lián)合宣布,雙方已完成各自語音助手Alexa和Cortana的整合。

二、AI語音助手的現(xiàn)狀——拼場景

場景一:連接硬件生態(tài)

由于語音交互核心環(huán)節(jié)上的一系列技術(shù)突破及人工智能公司提供的ToB解決方案,AI語音助手開始逐漸在技術(shù)層面上滿足人們的基本要求。

以小愛同學(xué)為例:它的語音和語義技術(shù)主要來自于多家合作伙伴,包括:Nuance、搜狗知音、思必馳、獵戶星空、聲智科技、海知智能、三角獸等。

語音識(shí)別技術(shù)(ASR)的接口,用的是思必馳、Nuance 與搜狗的(現(xiàn)在小米似乎是在自研)。自然語言理解(NLP)等關(guān)于語義方面的技術(shù),由小米大腦親自來做。前端的麥克風(fēng)陣列以及降噪方案,是由聲智科技提供的。語音合成技術(shù),是由獵戶星空提供的。很大程度上,自然語言解析技術(shù)已經(jīng)逐漸不再成為各家廣義智能助理產(chǎn)品的核心競爭力,識(shí)別用戶意圖之后所提供的服務(wù)開始成為對話機(jī)器人差異化的核心。而在這個(gè)時(shí)候,國內(nèi)公司中再次抓住頭部紅利的正是小米。

不得不說雷軍真的是一個(gè)非常有大勢思維的企業(yè)家,總能恰如其分地踩上時(shí)代紅利,正如他所說:“一個(gè)人要做成一件事情,其實(shí)本質(zhì)上不是在于你多強(qiáng),而是你要順勢而為,于萬仞之上推千鈞之石”。

他踩著智能手機(jī)大換代、消費(fèi)升級、網(wǎng)紅電商的紅利撐起了小米,這次他又抓住了人工智能目前布局最廣泛的智能硬件生態(tài)。

在評選世界互聯(lián)網(wǎng)領(lǐng)先科技成果獎(jiǎng)的介紹中,小米人工智能開放平臺(tái)是這么定義的:

小米人工智能開放平臺(tái),是一個(gè)以智能家居需求場景為出發(fā)點(diǎn),深度整合人工智能和物聯(lián)網(wǎng)能力,為用戶、軟硬件廠商和個(gè)人開發(fā)者提供智能場景及軟硬件生態(tài)服務(wù)的開放創(chuàng)新平臺(tái)。

著名產(chǎn)品人梁寧在《產(chǎn)品思維三十講》中分析了小米的三級火箭模式:

一級火箭:小米手機(jī),是小米的頭部流量,不為掙錢,雷軍也承諾小米硬件的綜合利潤率永遠(yuǎn)不會(huì)超過5%(根據(jù)小米的上市招股說明書,雷軍在這一塊真的沒有說謊)。

二級火箭:小米手機(jī)拉動(dòng)的一系列零售場景,小米商城、米家、小米之家、小米小店(小米11月18日將會(huì)在英國倫敦的Westfield mall落地在英國市場的第一家門店也是用MI8 pro打頭陣,并逐步開放其它商品和渠道)。

三級火箭:是一個(gè)高利潤產(chǎn)品,原文說“現(xiàn)在雷總還不愿意說出來”。

從小米上市招股說明書中的募集資金用途(小米計(jì)劃將30%募集資金用于研發(fā)及開發(fā)智能手機(jī)、電視、筆記本電腦、人工智能音箱等核心產(chǎn)品;30%用于全球擴(kuò)展;30%用于擴(kuò)大投資及強(qiáng)化生活消費(fèi)品與移動(dòng)互聯(lián)網(wǎng)產(chǎn)業(yè)鏈;剩下的10%用作日常經(jīng)營)。

從小米高層和雷軍的發(fā)言中可以知道:小米的三級火箭應(yīng)該就是AI+IOT,能真正撐起小米的利潤以及智能化未來。

根據(jù)世界互聯(lián)網(wǎng)大會(huì)給出的數(shù)據(jù):

截至2018年7月,小米投資或孵化了超過220家生態(tài)鏈公司,全球已有超過1.15億智能設(shè)備與小米IoT平臺(tái)連接,小米的AI語音服務(wù)-小愛同學(xué)月活躍用戶超過3000萬,單月喚醒超過10億次

在與硬件生態(tài)的連接上,小愛同學(xué)可以說有著得天獨(dú)厚的先發(fā)優(yōu)勢。

場景二:連接軟件生態(tài)

(1)打通操作系統(tǒng)場景

與手機(jī)操作系統(tǒng)MIUI的深度結(jié)合使得小愛同學(xué)能夠?qū)崿F(xiàn)手機(jī)中的通用指令功能,并且在現(xiàn)有技術(shù)范圍內(nèi)去發(fā)覺一些非常實(shí)用的優(yōu)化功能。對于手機(jī)操作系統(tǒng)上的通用功能,小愛同學(xué)可以直接調(diào)用執(zhí)行,比如最常見的設(shè)定鬧鐘等。

而對于不提供接口的手機(jī)APP,小愛同學(xué)可以通過虛擬按鍵操作模擬用戶執(zhí)行,個(gè)人覺得最有趣的操作就是讓小愛打開微信上某人的朋友圈。你可試試對小愛同學(xué)說:“打開XXX的朋友圈”,然后可以看到手機(jī)在自動(dòng)一步一步執(zhí)行以下操作:

進(jìn)入微信->進(jìn)入搜索頁面->進(jìn)入聊天頁面->進(jìn)入聊天信息頁面->進(jìn)入個(gè)人主頁->進(jìn)入朋友圈

我在使用其他手機(jī)進(jìn)行對比時(shí)是沒有辦法實(shí)現(xiàn)這個(gè)功能的,可見小米在打造產(chǎn)品的時(shí)候真的是想盡辦法在技術(shù)邊界內(nèi)盡可能地滿足用戶需求。

(2)打通外部軟件接口

你可以試試對小愛同學(xué)說:“打開美團(tuán)點(diǎn)外賣”,你會(huì)發(fā)現(xiàn)它可以和美團(tuán)自帶的小美智能助理會(huì)進(jìn)行無縫對接,在進(jìn)入美團(tuán)后順利讓小美來接管你的后續(xù)需求。這是在軟件生態(tài)中非常和諧的一種合作模式。

三、AI語音助手的未來

讓形象更可感——Gatebox

Gatebox是日本公司vinclu專門為宅男打造的一款全息影像人工智能管家,可以說日本人民是真的會(huì)玩,你可以去官網(wǎng)感受一下他們的宣傳片

第一個(gè)畫面,宅男在公司加班,Hikari Azuma通過Line發(fā)去了消息,“你記得今天是什么日子嗎?什么時(shí)候回來?”宅男說,“馬上回來!”Hikari Azuma:“好棒!”,隨手打開了家里的燈,等待主人回家。宅男回家后,Hikari Azuma立馬甜蜜問候:“歡迎回來。”然后羞答答地說:“今天是我們住在一起三個(gè)月紀(jì)念日,你記得嗎?”宅男立馬拿出了禮物,Hikari Azuma看到之后開心地鼓掌。宅男準(zhǔn)備好食物和酒,開始慶祝時(shí),Hikari Azuma把家里的燈光系統(tǒng)調(diào)節(jié)成了溫馨浪漫的風(fēng)格。最后,宅男和Hikari Azuma舉起酒杯,互相感謝對方的陪伴。視頻最后的一句話寫著:Living with characters(和二次元老婆一起生活)。

不少中國同胞在youtube上呼吁雷軍趕緊把這個(gè)公司買下,在中國用感動(dòng)人心的價(jià)格福利大眾,哈哈。

根據(jù)梅拉比安模型:感情表達(dá)=內(nèi)容7%+語調(diào)語氣38%+表情肢體語言55%,所以僅靠語言文字遠(yuǎn)遠(yuǎn)不夠,甚至像Google Duplex做到分辨不出說話者是AI還是人也還不夠,長期來說,更重要的會(huì)是“多模態(tài)交互”。

在Gatebox的交互中,比如調(diào)低燈光亮度時(shí),她會(huì)擺出朝燈呼氣的動(dòng)作,詢問天氣時(shí),她又會(huì)做出側(cè)身展示天氣預(yù)報(bào)的動(dòng)作。小愛同學(xué)是首個(gè)正式發(fā)布人工智能虛擬形象的AI語音助手,“米娘”的形象也受眾多米粉們喜愛,如果真的能把成本降下來的話,相信會(huì)有蠻多人(尤其是宅男們)入坑的。

退而求其次,就算不做全息影像,做一個(gè)平面投影也是可以的嘛。

讓關(guān)系更自然——Replika

Replika是Luka Inc.公司開發(fā)的一款Chatbot,據(jù)說初衷是為了緬懷兩位創(chuàng)始人在車禍中失去的摯友,通過搜集他生前的社交聊天預(yù)料來創(chuàng)建一位虛擬人。

拋開它作為一款Chatbot與AI語音助手的需求差別,我覺得它設(shè)計(jì)得非常好的是被稱為“反芻機(jī)制”的功能,將你在和它聊天時(shí)提到的語料在一段時(shí)間間隔之后提取出來,自然地插入到交流當(dāng)中,感覺就像你跟朋友提起你最近睡眠不好,過了一段時(shí)間后朋友會(huì)來關(guān)心你的近況,感覺非常的貼心。

真的有一種感覺,就像《小王子》里面有一段,小王子對小狐貍說我們一起玩啊,小狐貍回答說我現(xiàn)在還不能和你一起玩,因?yàn)槲疫€沒有被馴養(yǎng)。

馴養(yǎng)是指彼此共同投入一段時(shí)間,結(jié)成一種關(guān)系,人類是AI的訓(xùn)練師,但與此同時(shí),AI其實(shí)也在訓(xùn)練你如何與它進(jìn)行互動(dòng)?;蛟S只有這樣,千禧一代的互聯(lián)網(wǎng)原住民才能跨過未來與AI原住民之間的鴻溝。小愛同學(xué)雖然沒有Chatbot的這種天然場景,但還是有很多落地點(diǎn)的:

智能手機(jī)消息欄的推送,比如用戶說:“我最近睡眠不太好?!保蹠?huì)回復(fù):“多鍛煉有助睡眠。”,那么就可以推送“我記得你和我說過你睡眠不太好,小愛為你找到了一些催眠音樂,試試對我說:我想聽催眠音樂”;小愛音箱的對話,由于無法主動(dòng)開啟對話,可以選擇在識(shí)別到用戶當(dāng)前意圖與語料庫中的語義信息相關(guān)時(shí)補(bǔ)充對話,比如用戶說:“播放音樂”,小愛會(huì)回復(fù):“愛聽歌的人運(yùn)氣都不會(huì)太差哦”,那么可以再回復(fù)“我記得你說你注意力很難集中,要不要聽聽我給你推薦的輕音樂?”。

讓對話更真實(shí)——Google Duplex

在5月9日的Google I/O大會(huì)上,Google Duplex的一句 “umms”著實(shí)讓人驚艷,5 月 11 日,谷歌母公司 Alphabet 董事長(前斯坦福校長)John Hennessy 表示,他們還達(dá)成了一項(xiàng)里程碑成績 ——Duplex (部分)通過了圖靈測試。

對Google Duplex不了解的朋友,如果能科學(xué)上網(wǎng)的話,可以到Google AI Blog上看看Google官方的介紹原文:

以下對Google Duplex的技術(shù)認(rèn)知來源于蟲門科技郭靖的文章,這是我看到的對Google Duplex最深入的分析,感興趣的朋友可以點(diǎn)擊鏈接閱讀原文:

Google Duplex讓對話如此真實(shí)主要是體現(xiàn)在兩大塊——自然語言理解與對話模塊、文本轉(zhuǎn)語音模塊。

(1)文本轉(zhuǎn)語音模塊

文本轉(zhuǎn)語音模塊(即語音合成)技術(shù)比較明了,在博客中交代得比較清楚,沒有什么懸念。

We use a combination of a concatenative text to speech (TTS) engine and a synthesis TTS engine (using Tacotron and WaveNet) to control intonation depending on the circumstance.我們結(jié)合使用聯(lián)結(jié)式文本到語音(TTS)引擎和綜合TTS引擎(使用Tacotron和WaveNet)來控制語調(diào),具體取決于環(huán)境。

(2)自然語言理解與對話模塊

在自然語言理解與對話模塊的具體實(shí)現(xiàn)上Google就不是很老實(shí)了,只是給了一些比較寬泛的概念。

郭靖在他的文章中給出了以下猜想:

在這個(gè)猜想的架構(gòu)中,用戶的語音通過ASR識(shí)別為文字后,會(huì)通過預(yù)設(shè)的規(guī)則轉(zhuǎn)化為形式語言,將重要實(shí)體用形式模板代替。

這樣形式化后的文本與語音、上文的形式文本一起送入一個(gè)encoder模型,其將這些原始信息編碼成兩個(gè)語義信息向量,一個(gè)代表本輪用戶的語言,另一個(gè)代表上幾輪對話。

同時(shí),通過ASR識(shí)別的文本還會(huì)與上幾輪對話的文本、通過Google Assistant傳來的條件參數(shù)(代表對話的目標(biāo),用戶本身的信息等大前提)一起進(jìn)入另一個(gè)網(wǎng)絡(luò),其根據(jù)輸入的信息輸出一個(gè)代表當(dāng)前對話狀態(tài)信息的向量。

這一網(wǎng)絡(luò)很可能具備每一輪對話為一個(gè)step的循環(huán)結(jié)構(gòu),意味著這個(gè)對話狀態(tài)信息的更新會(huì)參考前一輪對話狀態(tài)的信息。

當(dāng)然,在拿著錘子找釘子的當(dāng)下,這一塊就太偏前沿技術(shù)了,但是對于AI,對于整個(gè)人類歷史,技術(shù)始終都是推動(dòng)發(fā)展的源動(dòng)力。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • AI語音助手
    +關(guān)注

    關(guān)注

    0

    文章

    20

    瀏覽量

    4134
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    2025年AI智能語音助手市場發(fā)展趨勢與樂鑫芯片解決方案分析

    2025年AI語音助手市場爆發(fā)式增長,全球訪問量翻倍,企業(yè)普及率達(dá)97%。NLP技術(shù)突破(語義準(zhǔn)確率超95%)與邊緣計(jì)算支持驅(qū)動(dòng)發(fā)展,產(chǎn)品向多模態(tài)交互進(jìn)階。三大應(yīng)用場景潛力顯著:企業(yè)客服(滿意度提升
    的頭像 發(fā)表于 07-05 11:26 ?292次閱讀

    最新人工智能硬件培訓(xùn)AI基礎(chǔ)入門學(xué)習(xí)課程參考2025版(離線AI語音視覺識(shí)別篇)

    端側(cè)離線 AI 智能硬件作為 AI 技術(shù)的重要載體之一,憑借其無需依賴網(wǎng)絡(luò)即可實(shí)現(xiàn)智能功能的特性,在一些網(wǎng)絡(luò)條件受限或?qū)?shù)據(jù)隱私有較高要求的場景中,發(fā)揮著不可或缺的作用。本章基于CSK
    發(fā)表于 07-04 11:14

    語音助手只能聊天?啟明云端AI語音交互方案偷偷修煉了音樂才藝!

    語音助手只能聊天?太out了!”語音交互的新樂章已經(jīng)奏響!啟明云端基于樂鑫科技芯片的AI語音方案正式解鎖音樂技能樹,只需一句指令,
    的頭像 發(fā)表于 06-27 18:03 ?161次閱讀
    <b class='flag-5'>語音</b><b class='flag-5'>助手</b>只能聊天?啟明云端<b class='flag-5'>AI</b><b class='flag-5'>語音</b>交互方案偷偷修煉了音樂才藝!

    廣東移動(dòng)攜手華為開啟AI生活新范式

    近日,世界電信和信息社會(huì)日前夕,廣東移動(dòng)舉行移起AI——2025年三大服務(wù)計(jì)劃發(fā)布會(huì),并舉行AI終端生態(tài)聯(lián)盟啟動(dòng)儀式。華為等多家廣東移動(dòng)的戰(zhàn)略合作伙伴傾力合作,以5G-A、AI 新技術(shù)雙輪驅(qū)動(dòng),
    的頭像 發(fā)表于 05-19 12:35 ?461次閱讀

    2025年開啟AI智能體規(guī)模應(yīng)用

    % 躍升至 2028年的 33%;同時(shí),超過 15% 的日常工作決策將交由 AI 智能體自主完成。隨著生成式 AI 的加速普及、AI 智能
    的頭像 發(fā)表于 05-09 11:09 ?567次閱讀

    正點(diǎn)原子 AI BOX0 智能伴侶,1.54寸高清屏+長效續(xù)航,語音暢聊,情景對話,知識(shí)科普,多色可選,隨身攜帶!

    正點(diǎn)原子 AI BOX0攜小智AI來襲,專屬你的智能伴侶!你的全能AI伙伴,懂你更貼心 正點(diǎn)原子ESP32 AI BOX0 — 不只是桌面擺
    發(fā)表于 04-24 16:11

    智能家居Mesh組網(wǎng)方案:實(shí)現(xiàn)智能化生活的無縫連接NRF52832

    通過智能語音助手或手機(jī)應(yīng)用,實(shí)現(xiàn)對家庭中各個(gè)智能設(shè)備的集中控制和聯(lián)動(dòng)操作,為家居生活帶來便利和舒適。 2、商業(yè)照明:該方案同樣適用于商業(yè)照明
    發(fā)表于 04-15 14:07

    AI全能助手 三星Galaxy S25系列讓生活更高效便捷

    的Galaxy AI和全新的Samsung One UI 7,打破了傳統(tǒng)智能手機(jī)的操作界限,通過更智能的感知能力、更強(qiáng)大的跨應(yīng)用執(zhí)行力和更便捷的信息管理方式,讓AI真正成為用戶
    的頭像 發(fā)表于 03-24 16:05 ?409次閱讀

    思必馳天琴語音助手8.0深度融合DeepSeek

    智能汽車加速向場景化服務(wù)迭代的進(jìn)程中,智能語音助手已成為駕駛體驗(yàn)中不可或缺的一部分。思必馳天琴語音助手
    的頭像 發(fā)表于 02-28 17:43 ?1476次閱讀

    啟明智顯AI解決方案,用AI生活助手角度打開AI智能體的一天

    啟明智顯AI解決方案打造AI生活助手,用AI智能體的角度看A
    的頭像 發(fā)表于 02-26 14:43 ?642次閱讀
    啟明智顯<b class='flag-5'>AI</b>解決方案,用<b class='flag-5'>AI</b><b class='flag-5'>生活</b><b class='flag-5'>助手</b>角度打開<b class='flag-5'>AI</b><b class='flag-5'>智能</b>體的一天

    AI賦能邊緣網(wǎng)關(guān):開啟智能時(shí)代的新藍(lán)海

    在數(shù)字化轉(zhuǎn)型的浪潮中,AI與邊緣計(jì)算的結(jié)合正掀起一場深刻的產(chǎn)業(yè)變革。邊緣網(wǎng)關(guān)作為連接物理世界與數(shù)字世界的橋梁,在AI技術(shù)的加持下,正從簡單的數(shù)據(jù)采集傳輸節(jié)點(diǎn),進(jìn)化為具備智能決策能力的邊緣計(jì)算單元
    發(fā)表于 02-15 11:41

    遠(yuǎn)程智能家居控制:開啟智能生活新時(shí)代

    隨著物聯(lián)網(wǎng)技術(shù)的發(fā)展,遠(yuǎn)程智能家居控制走進(jìn)人們的生活,為大家開啟智能生活的全新篇章。 遠(yuǎn)程智能
    的頭像 發(fā)表于 01-20 13:05 ?725次閱讀

    AI芯片在智能手機(jī)中具體怎么用?

    物,并允許用戶單獨(dú)編輯每個(gè)部分。 語音識(shí)別和智能助手AI芯片可以實(shí)現(xiàn)對用戶語音的實(shí)時(shí)識(shí)別和處理,提供
    的頭像 發(fā)表于 01-03 14:02 ?1096次閱讀

    基于W2605C語音識(shí)別合成芯片的智能語音交互鬧鐘方案-AI對話享受智能生活

    隨著科技的飛速發(fā)展,智能家居產(chǎn)品正逐步滲透到我們的日常生活中,其中智能鬧鐘作為時(shí)間管理的得力助手,也在不斷進(jìn)化?;赪2605C語音識(shí)別與
    的頭像 發(fā)表于 12-31 11:54 ?885次閱讀

    SoundHound AI語音助手賦能歐洲汽車,引領(lǐng)智能駕駛新風(fēng)尚

    近日,全球領(lǐng)先的AI語音技術(shù)獨(dú)角獸企業(yè)SoundHound AI宣布了一項(xiàng)重要合作成果:其集成ChatGPT技術(shù)的先進(jìn)語音助手SoundHo
    的頭像 發(fā)表于 08-01 17:49 ?1206次閱讀