chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

人工智能公司思必馳語音合成技術表現(xiàn)如何?

思必馳 ? 來源:思必馳 ? 作者:思必馳 ? 2021-06-04 16:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

語音合成,是對話式人工智能的最后一環(huán),也是關鍵一環(huán),它的效果直接影響著人機語音交互的體驗。思必馳作為國內領先的對話式人工智能平臺公司,它的語音合成技術表現(xiàn)究竟如何?

語音合成的“前世今生”

語音合成(Text to Speech,TTS)又稱文本語音轉換技術,顧名思義,是把文本信息轉化成語音信息。人的語音,本質上是發(fā)音器官震動,產生聲波傳出。

模仿人聲,最古老的方法是使用樂器。到 19 世紀,就可以用機械方法產生語音了。那時,科學家們會制作出一些精巧的氣囊和風箱去搭建發(fā)聲系統(tǒng),合成出一些元音和單音。

進入電子時代的 1939 年,貝爾實驗室 H · 杜德利制作出第一臺電子合成器,這是用共振峰原理制作的語音合成器,該技術使用固定頻率,以電子復制我們改變口型時所發(fā)出的元音聲,也這正是英國劍橋大學著名物理學家斯蒂芬·霍金教授所使用的聲音合成器。

上世紀 90 年代,隨著計算和存儲能力大幅度提升,基于大語料庫的單元挑選與波形拼接合成方法出現(xiàn),可以合成出高質量的自然人語音。

進入21世紀,隨著深度學習技術的興起和快速發(fā)展,以語音合成為代表的語音處理技術得到了極大的飛躍。神經(jīng)網(wǎng)絡語音合成在近幾年來取得了顯著突破,合成?的?質和?然度越來越?,運?速度也越來越快。思必馳目前所使用的,也正是這種方法。

思必馳TTS,魅力何在?

早在2007年于英國劍橋大學創(chuàng)立時,思必馳關于語音合成技術研究就已開啟,該項工作由思必馳聯(lián)合創(chuàng)始人兼首席科學家、上海交通大學教授俞凱領頭。

語音合成系統(tǒng)主要分為文本處理、聲學模型、聲碼器三個部分。文本處理負責對文本進行轉寫和phoneme序列轉換;聲學模型使用深度神經(jīng)網(wǎng)絡,可以在文本特征與聲學特征之間學習到更復雜的非線性關系;聲碼器負責將聲學模型輸出的聲學特征,通過卷積運算,轉換成音頻。

經(jīng)過10多年的研究積累,思必馳在建模方法上,涵蓋了從傳統(tǒng)的統(tǒng)計參數(shù)模型到最新的基于神經(jīng)網(wǎng)絡的方法;對聲碼器的研究,涵蓋了從傳統(tǒng)的基于信號處理的方法到最新的基于神經(jīng)網(wǎng)絡的方法。

語音合成的質量與效果,既有賴于語音廠商的算法模型,還取決于音頻語料的質量,即數(shù)據(jù)質量。思必馳有著豐富的聲優(yōu)資源以及聲優(yōu)挑選的經(jīng)驗,在蘇州建設有專業(yè)錄?棚并與國內多個城市的錄?棚有著長久合作關系。與此同時,思必馳數(shù)據(jù)團隊也對數(shù)據(jù)標注有著嚴格的質量把控。

經(jīng)過多年的技術積累,思必馳已逐步形成了?套成熟的技術?案,業(yè)務涵蓋了?數(shù)據(jù)語?定制、?數(shù)據(jù)快速定制、聲?克隆、歌聲合成、?語種合成、??合成、情感合成等,可選公有云、私有云以及離線三種部署?式,經(jīng)典??可在思必馳官?實時體驗。

2017年、2020年,思必馳還先后參與國家標準《中文語音合成互聯(lián)網(wǎng)服務接口規(guī)范》與行業(yè)標準《中文語音合成服務系統(tǒng)評估規(guī)范》的制定,并成為全國首批通過評估測評的公司之一,獲得“TTS-4S(Standard Similarity Scene System)服務證書”。該測評從合成質量、定制能力、場景表現(xiàn)力和系統(tǒng)安全可靠等維度,全面評估合成水平和服務能力。

未來世界,百“聲”爭鳴

為能快速提供語音合成定制服務,思必馳全程提供音色選擇、錄音指導、音頻處理、模型訓練、服務部署等專業(yè)服務,賦予產品開口講話的能?。

截至目前,思必馳語音合成已建設的??庫內包含音色接近200個,涵蓋多種??、多種風格,以及各個年齡層次。

思必馳語音合成服務,也已在車載、?電、機器?、智能客服等諸多領域成功落地,為眾多終端產品賦予聲的魅力,使得萬物皆可溝通,并逐漸走入人們的工作與生活。

當你在家里“躺平”,來自如影智能的語音管家“Edison”,用他溫暖、紳士的聲音(文章開頭的音頻A),為你帶來踏實與慰藉;當你在愛車中馳騁,車蘿卜的語音助理“蘿卜”清脆、簡明的聲音,如同車水馬龍路途中的一股清流;當你接起順豐95338服務熱線的外呼電話,智能客服“豐小蜜”親切又不失嚴謹?shù)穆曇?,配合高效的工作能力,帶給你最省心省力的服務體驗……

鏡頭切換到泛娛樂領域,思必馳團隊打造的“小馳機器人”在央視《機智過人》中,現(xiàn)場用撒貝寧的聲音生成了一曲《好久不見》。在《經(jīng)典詠流傳》中,思必馳攜手欄目組共同推出 “讀詩成曲”線上互動小工具,提供實時讀詩成曲的能?。用戶僅需讀幾句簡單的詩詞,便可快速生成有腔有韻的歌聲,互動總量超過821萬人次。

在個性化定制上,思必馳不僅可以提供普通話定制、歌聲定制,還可以通過遷移學習方法,提供更高難度的方言、小語種TTS定制,如粵語、上海語、四川話、?東話、東北話、德語、法語等。

而思必馳的情感合成技術,則賦予美妙音色豐沛的情緒,讓聲音更具表現(xiàn)力與感染力。

此外,思必馳聲音復刻技術也已在斑馬智能、愛馳汽車、嵐圖汽車、仙豆智能等車聯(lián)網(wǎng)客戶以及IoT領域落地,僅需錄音20句話約400漢字,10分鐘之內便可以完成模型生產,MOS 合成音/錄音達到90%,相似度合成音/錄音達到80%。

人類的聲音,是人類語言的物質外殼,卻承載著重要的信息和真摯的情感,擁有著無窮的魅力。人工智能突飛猛進地發(fā)展正不斷催化人機交互方式的巨變,“萬物可溝通、萬事可打理”的語音互聯(lián)未來世界,正加速到來……

原文標題:做道聽力題,檢驗下思必馳TTS技術

文章出處:【微信公眾號:思必馳】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1811

    文章

    49504

    瀏覽量

    258242
  • 思必馳
    +關注

    關注

    4

    文章

    362

    瀏覽量

    15794

原文標題:做道聽力題,檢驗下思必馳TTS技術

文章出處:【微信號:思必馳,微信公眾號:思必馳】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    語音平臺項目通過ASPICE 2級能力認證

    近日,為梅賽德斯-奔馳打造的語音平臺項目正式通過Automotive SPICE(ASPICE)2級能力認證。這一成果標志著
    的頭像 發(fā)表于 09-30 11:35 ?661次閱讀

    聲音轉換算法通過國家備案

    近日,國家互聯(lián)網(wǎng)信息辦公室公告第十三批深度合成服務算法備案信息,聲音轉換算法通過備案,這也是
    的頭像 發(fā)表于 09-18 14:05 ?496次閱讀

    一鳴智能客服大模型通過生成式人工智能服務備案

    近日,江蘇網(wǎng)信發(fā)布新一批生成式人工智能服務備案信息,其中,由控股子公司
    的頭像 發(fā)表于 09-16 18:08 ?783次閱讀

    8月份大事件回顧

    近日,與奧迪全新一代智能網(wǎng)聯(lián)車型合作正式量產落地。
    的頭像 發(fā)表于 09-03 09:07 ?554次閱讀

    與奧迪全新一代智能網(wǎng)聯(lián)車型合作正式量產落地

    近日,與奧迪全新一代智能網(wǎng)聯(lián)車型合作正式量產落地。
    的頭像 發(fā)表于 08-15 10:53 ?851次閱讀

    空調大模型解決方案

    這不是幻想,是基于思空調大模型解決方案發(fā)生的真實體驗,該方案深度融合了自研的全鏈路智能
    的頭像 發(fā)表于 07-31 17:46 ?598次閱讀

    聲音復刻算法獲得深度合成服務算法備案

    近日,國家互聯(lián)網(wǎng)信息辦公室正式發(fā)布第十二批深度合成服務算法備案信息,聲音復刻算法通過此次備案。該算法能夠高精度復刻人類聲音,為個性化語音
    的頭像 發(fā)表于 07-31 17:42 ?582次閱讀

    亮相2025世界人工智能大會

    近日,2025世界人工智能大會暨人工智能全球治理高級別會議(WAIC2025)在上海盛大開幕。本屆大會以“智能時代 同球共濟”為主題,全方位呈現(xiàn)了全球AI技術突破、產業(yè)變革與治理實踐的
    的頭像 發(fā)表于 07-31 17:41 ?610次閱讀

    7月份大事件回顧

    近日,聲音復刻算法通過國家互聯(lián)網(wǎng)信息辦公室第十二批深度合成服務算法備案。該算法能夠高精度復刻人類聲音,通過少量的錄音訓練得到極為相似的聲音模型,快速“克隆”個性化的聲音,為
    的頭像 發(fā)表于 07-28 17:52 ?485次閱讀

    宣布,再獲新一輪融資

    自主品牌在辦公會議場景的深度創(chuàng)新、推動產品迭代與升級。 ? 成立于2007年,是國內領先的對話式人工智能平臺公司。自創(chuàng)立以來,
    的頭像 發(fā)表于 06-26 01:09 ?3524次閱讀

    何維率一行蒞臨調研

    現(xiàn)場,董事長、CEO高始興介紹了的業(yè)務布局與落地應用情況。
    的頭像 發(fā)表于 04-24 15:36 ?583次閱讀

    出席語言計算技術創(chuàng)新專題研討會

    近日,與東南大學蘇州校區(qū)聯(lián)合舉辦語言計算技術創(chuàng)新專題研討暨校企合作洽談會。
    的頭像 發(fā)表于 04-17 15:42 ?469次閱讀

    柳州市領導蒞臨調研考察

    創(chuàng)新成果落地等主題開展專題調研。此次調研聚焦思智能語音交互、大模型技術融合及產業(yè)鏈協(xié)同等領域的發(fā)展成效,并深入了解企業(yè)需求,鼓勵企業(yè)加
    的頭像 發(fā)表于 03-24 16:37 ?984次閱讀

    亮相2025年蘇州市“人工智能+”創(chuàng)新發(fā)展推進大會

    近日,2025年蘇州市“人工智能+”創(chuàng)新發(fā)展推進大會暨人工智能賦能新型工業(yè)化深度行(蘇州站)活動隆重舉行,專家學者、產業(yè)大咖、金融精英齊聚蘇州,共商“人工智能+”融合創(chuàng)新。作為人工智能
    的頭像 發(fā)表于 02-17 16:16 ?807次閱讀

    攜手長城汽車入選2024年人工智能先鋒案例集

    日前,中國人工智能產業(yè)發(fā)展聯(lián)盟《2024年人工智能先鋒案例集》正式發(fā)布,長城汽車與聯(lián)合申報的“長城汽車Coffee Al
    的頭像 發(fā)表于 11-26 17:56 ?1688次閱讀