chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

海岸語音石偉:聲矢量技術(shù)帶入消費級市場還遠遠不夠 我們的目標(biāo)是整條語音技術(shù)鏈條

h1654155972.5709 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:工程師譚軍 ? 2018-07-14 09:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

互聯(lián)網(wǎng)發(fā)展至今,面對人工智能大時代的到來,智慧、高效、便捷的人工智能研發(fā)應(yīng)用,發(fā)展智能產(chǎn)業(yè)成為科技行業(yè)工作的重中之重。協(xié)會特派記者走進深圳海岸語音技術(shù)有限公司,對石偉總經(jīng)理進行了智能語音行業(yè)相關(guān)專訪。

深圳海岸語音技術(shù)有限公司創(chuàng)始人、總經(jīng)理 石偉

記者:智能語音作為人工智能應(yīng)用最成熟的技術(shù)之一,科技巨頭、初創(chuàng)公司紛紛布局,海岸語音是怎樣定位與布局?

石偉:從人機交互形式出發(fā),語音識別無疑是人工智能產(chǎn)品與用戶之間,最便捷有效的交流形式。語音交互技術(shù)鏈條較長,包括語音識別前端處理、語音識別、語義理解、語音合成等環(huán)節(jié)。在語音識別方面,百度、科大訊飛、谷歌等技術(shù)領(lǐng)先。我們主要做語音識別前端處理的技術(shù),是一家專注于智能聽覺感知技術(shù)的人工智能初創(chuàng)企業(yè),面向物聯(lián)網(wǎng)和人工智能時代,提供軟、硬件結(jié)合加云端引擎的一體化智能聽覺感知技術(shù)解決方案。

記者:海岸語音的產(chǎn)品及應(yīng)用有哪些?

石偉:有別于傳統(tǒng)的標(biāo)量麥克風(fēng)技術(shù),我們產(chǎn)品所采用的是聲學(xué)矢量傳感技術(shù),可同時測量聲場的聲壓信息和方向信息,該技術(shù)最早源于潛艇的矢量水聽器,在空氣中的應(yīng)用極少。我們團隊歷經(jīng) 8 年研發(fā),打造出 AI 時代必不可少的“機器耳朵”:VecSense ? 智能聲矢量傳感器。該傳感器是世界首款消費級聲矢量傳感器,可以應(yīng)用在機器人、智能音箱、家電等諸多領(lǐng)域。

記者:海岸語音的核心競爭力體現(xiàn)在哪些方面?

石偉:把產(chǎn)品做小、成本做低(幾美元左右)是我們研發(fā)的方向。目前 VecSense ? 智能聲矢量傳感器比一毛錢硬幣還小三分之一,性能高、成本低、體積小的特性使其在智能語音、機器人、智能家居、無人機、穿戴式設(shè)備以及智能車載等領(lǐng)域都有廣闊的應(yīng)用前景。

作為 AI 時代機器必備的器件之一,“機器耳朵”需要更多的信息實現(xiàn)其智能的特性,這是傳統(tǒng)的標(biāo)量麥克風(fēng)所面臨的局限性。雖然在聲學(xué)傳感器的發(fā)展史上,各大研究機構(gòu)嘗試了通過多種方式獲取除了聲壓信息以外的聲音方向信息,但這些技術(shù)都具有各類不同的缺陷,使其無法在消費級產(chǎn)品中使用。

我們在小尺寸的單顆傳感器封裝內(nèi)實現(xiàn)平面 360°聲音定向,并內(nèi)置多種語言 / 音頻智能算法。不僅在聽音辨位、抑制干擾、遠場拾音方面表現(xiàn)出超強的性能,因其獨特的信號特性還能做到出色語音分離,讓智能機器同時聽懂多個說話人的指令。

在數(shù)量、尺寸、功耗和成本方面,一顆 VecSense ?傳感器對應(yīng)四至八顆傳感器組成的麥克風(fēng)陣列,顯然具有突出的優(yōu)勢:尺寸減少 70%,功耗降低 90%,同時成本可降低 90%。

記者:海岸語音發(fā)展過程中有遇到哪些困難?

石偉:目前我們產(chǎn)品還未正式推向市場,產(chǎn)品還在不斷地優(yōu)化,找到行業(yè)典型應(yīng)用是將要面臨的一大挑戰(zhàn)。在未來推向市場的時候,產(chǎn)品的正式落地希望能夠找到知名度較高的產(chǎn)品或廠商背書,進一步打開市場。

記者:石總怎么看待科技巨頭與初創(chuàng)公司在智能語音領(lǐng)域的發(fā)展模式?

石偉:科技巨頭主要打造開發(fā)者生態(tài)系統(tǒng),使用算法平臺吸引開發(fā)者,實現(xiàn)數(shù)據(jù)的快速積累、產(chǎn)品的快速迭代。目前,在國內(nèi)智能語音領(lǐng)域,科大訊飛是做得比較完善,一整條產(chǎn)業(yè)鏈相關(guān)技術(shù)產(chǎn)品都有涉及,并將自身語音技術(shù)植入相關(guān)合作伙伴的產(chǎn)品中,以推動智能語音和人工智能技術(shù)在家居、車載、可穿戴等領(lǐng)域的落地。

初創(chuàng)公司目前以垂直領(lǐng)域和細分場景為突破口,切入產(chǎn)品場景應(yīng)用。初創(chuàng)企業(yè)不應(yīng)求大、求全,而是結(jié)合自身優(yōu)勢做最“性感”的技術(shù)和產(chǎn)品。

記者:海岸語音未來有些什么規(guī)劃?

石偉:海岸語音目前專注語音識別前端處理,未來將從前端向一整條語音技術(shù)鏈條進行滲透,實現(xiàn)音頻和視頻融合的人機交互。我們會將底層的技術(shù)打包為完整的交互解決方案,服務(wù) B 端客戶。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人機交互
    +關(guān)注

    關(guān)注

    12

    文章

    1278

    瀏覽量

    57677
  • 人工智能
    +關(guān)注

    關(guān)注

    1813

    文章

    49807

    瀏覽量

    262207
  • 智能語音
    +關(guān)注

    關(guān)注

    11

    文章

    823

    瀏覽量

    50088

原文標(biāo)題:對話 | 將聲矢量技術(shù)帶入消費級市場—專訪深圳海岸語音技術(shù)有限公司總經(jīng)理石偉

文章出處:【微信號:SRA2009,微信公眾號:深圳市機器人協(xié)會】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    MAC CE技術(shù)為什么能調(diào)整語音編碼速率

    隨著NR網(wǎng)絡(luò)的快速發(fā)展,5G語音業(yè)務(wù)快速增加,5G支持高清語音,需要從技術(shù)上讓語音編碼適應(yīng)網(wǎng)絡(luò)覆蓋的技術(shù),商用外場這種訴求越發(fā)強烈,VoNR
    的頭像 發(fā)表于 12-19 16:52 ?335次閱讀
    MAC CE<b class='flag-5'>技術(shù)</b>為什么能調(diào)整<b class='flag-5'>語音</b>編碼速率

    WT2605C語音芯片32音量可調(diào)功能:重新定義音頻體驗

    一、突破性音量調(diào)節(jié)技術(shù)1.1技術(shù)規(guī)格概述作為語音芯片領(lǐng)域的技術(shù)領(lǐng)先者,廣州唯創(chuàng)電子推出的WT2605C聲音播放芯片集成了32精確音量控制功
    的頭像 發(fā)表于 11-10 13:00 ?461次閱讀
    WT2605C<b class='flag-5'>語音</b>芯片32<b class='flag-5'>級</b>音量可調(diào)功能:重新定義音頻體驗

    語音芯片白噪音支持功能詳解:打造舒適音頻體驗的關(guān)鍵技術(shù) | 廣州唯創(chuàng)電子語音IC廠家

    前言:探索語音芯片的白噪音技術(shù)世界在現(xiàn)代電子設(shè)備日益普及的今天,語音芯片的功能創(chuàng)新正在不斷豐富著我們的日常生活體驗。作為專業(yè)的語音IC廠家,
    的頭像 發(fā)表于 11-06 08:56 ?208次閱讀
    <b class='flag-5'>語音</b>芯片白噪音支持功能詳解:打造舒適音頻體驗的關(guān)鍵<b class='flag-5'>技術(shù)</b> | 廣州唯創(chuàng)電子<b class='flag-5'>語音</b>IC廠家

    一款工業(yè)MP3語音芯片介紹

    ,憑借其出色的性能與穩(wěn)定性,為娛樂設(shè)備提供了專業(yè)的音頻解決方案。(廣州語創(chuàng)專業(yè)語音芯片方案供應(yīng)商) 核心技術(shù)優(yōu)勢 1. 高速響應(yīng)與流暢體驗 YC686具備業(yè)界領(lǐng)先的指令響應(yīng)速度: · 曲目播放響應(yīng)
    發(fā)表于 09-08 10:33

    語音機器人交互系統(tǒng):核心技術(shù)與應(yīng)用挑戰(zhàn)

    ? ? ? 語音機器人交互系統(tǒng)是融合多學(xué)科技術(shù)的復(fù)雜工程,其核心目標(biāo)是實現(xiàn)人與機器間的自然、流暢語音對話。該系統(tǒng)已廣泛應(yīng)用于智能客服、智能家居、企業(yè)助手等場景,其
    的頭像 發(fā)表于 09-02 11:08 ?607次閱讀

    瑞芯微RK3576語音識別算法

    1.語音識別簡介語音識別技術(shù),也被稱為自動語音識別(AutomaticSpeechRecognition,ASR),其目標(biāo)是將人類的
    的頭像 發(fā)表于 08-15 15:13 ?1893次閱讀
    瑞芯微RK3576<b class='flag-5'>語音</b>識別算法

    語音識別---大家怎么看呢?

    語音識別是一門交叉學(xué)科。近二十年來,語音識別技術(shù)取得顯著進步,開始從實驗室走向市場。人們預(yù)計,未來10年內(nèi),語音識別
    發(fā)表于 08-09 10:54

    AP-0316 語音模組:不止是降噪神器,更是即插即用的 USB 聲卡全能王

    。 聲卡性能,降噪消回音雙開掛作為 USB 聲卡,它的 “聲音處理力” 堪稱頂流: AI 降噪(最高 90dB):通過 USB 傳輸?shù)穆曇?,會先?jīng)過智能過濾 —— 風(fēng)扇、鍵盤、窗外雜音全被
    發(fā)表于 07-18 10:06

    智能語音新風(fēng)尚:WTK6900語音識別芯片賦能未來家居,讓涼爽觸“”可及

    在人工智能技術(shù)飛速發(fā)展的今天,語音交互正以顛覆性的方式重塑我們的生活體驗。WTK6900系列語音識別芯片憑借其離線高性能、抗噪遠場識別、毫秒
    的頭像 發(fā)表于 04-08 08:43 ?1025次閱讀
    智能<b class='flag-5'>語音</b>新風(fēng)尚:WTK6900<b class='flag-5'>語音</b>識別芯片賦能未來家居,讓涼爽觸“<b class='flag-5'>聲</b>”可及

    芯知識|廣州唯創(chuàng)電子語音芯片電流問題解析與解決方案

    語音芯片在播放音頻時出現(xiàn)電流是嵌入式音頻系統(tǒng)開發(fā)中的常見問題,直接影響用戶體驗。廣州唯創(chuàng)電子WT系列語音芯片在智能家居、工業(yè)控制等領(lǐng)域廣泛應(yīng)用,本文將從PWM直推輸出與DAC+功放輸出兩類典型電路
    的頭像 發(fā)表于 03-28 08:44 ?1257次閱讀
    芯知識|廣州唯創(chuàng)電子<b class='flag-5'>語音</b>芯片電流<b class='flag-5'>聲</b>問題解析與解決方案

    廠家芯資訊|廣州唯創(chuàng)電子語音識別芯片技術(shù)解析

    、音頻編解碼等核心技術(shù),廣泛應(yīng)用于智能家居、工業(yè)設(shè)備、醫(yī)療電子及消費類產(chǎn)品中。二、核心技術(shù)特點語音識別與處理技術(shù)廠家
    的頭像 發(fā)表于 03-19 08:46 ?668次閱讀
    廠家芯資訊|廣州唯創(chuàng)電子<b class='flag-5'>語音</b>識別芯片<b class='flag-5'>技術(shù)</b>解析

    語音識別技術(shù)在通信領(lǐng)域中的應(yīng)用實例

    語音識別技術(shù)也被稱為自動語音識別(Automatic Speech Recognition,ASR),是通過計算機對語音信號進行分析和識別,將人類的
    的頭像 發(fā)表于 02-21 17:12 ?1113次閱讀

    詳解語音識別技術(shù)在通信領(lǐng)域中的應(yīng)用

    語音識別技術(shù)也被稱為自動語音識別(Automatic Speech Recognition,ASR),是通過計算機對語音信號進行分析和識別,將人類的
    的頭像 發(fā)表于 02-21 17:05 ?1055次閱讀
    詳解<b class='flag-5'>語音</b>識別<b class='flag-5'>技術(shù)</b>在通信領(lǐng)域中的應(yīng)用

    TTS語音播報模塊簡介

    在現(xiàn)代科技日新月異的時代,語音技術(shù)作為人工智能領(lǐng)域的重要分支,正以前所未有的速度改變著我們的生活方式。其中,TTS(Text To Speech,文本轉(zhuǎn)語音)
    的頭像 發(fā)表于 02-18 16:16 ?1963次閱讀

    HarmonyOS NEXT 應(yīng)用開發(fā)練習(xí):AI智能語音播報

    (Text-To-Speech,文本轉(zhuǎn)語音技術(shù)將文本轉(zhuǎn)換為語音進行播報。 當(dāng)然除了基本的文本輸入和播報功能外,我們增加了
    發(fā)表于 01-06 15:33