chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

人工智能公司思必馳語(yǔ)音合成技術(shù)表現(xiàn)如何?

思必馳 ? 來(lái)源:思必馳 ? 作者:思必馳 ? 2021-06-04 16:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

語(yǔ)音合成,是對(duì)話式人工智能的最后一環(huán),也是關(guān)鍵一環(huán),它的效果直接影響著人機(jī)語(yǔ)音交互的體驗(yàn)。思必馳作為國(guó)內(nèi)領(lǐng)先的對(duì)話式人工智能平臺(tái)公司,它的語(yǔ)音合成技術(shù)表現(xiàn)究竟如何?

語(yǔ)音合成的“前世今生”

語(yǔ)音合成(Text to Speech,TTS)又稱文本語(yǔ)音轉(zhuǎn)換技術(shù),顧名思義,是把文本信息轉(zhuǎn)化成語(yǔ)音信息。人的語(yǔ)音,本質(zhì)上是發(fā)音器官震動(dòng),產(chǎn)生聲波傳出。

模仿人聲,最古老的方法是使用樂(lè)器。到 19 世紀(jì),就可以用機(jī)械方法產(chǎn)生語(yǔ)音了。那時(shí),科學(xué)家們會(huì)制作出一些精巧的氣囊和風(fēng)箱去搭建發(fā)聲系統(tǒng),合成出一些元音和單音。

進(jìn)入電子時(shí)代的 1939 年,貝爾實(shí)驗(yàn)室 H · 杜德利制作出第一臺(tái)電子合成器,這是用共振峰原理制作的語(yǔ)音合成器,該技術(shù)使用固定頻率,以電子復(fù)制我們改變口型時(shí)所發(fā)出的元音聲,也這正是英國(guó)劍橋大學(xué)著名物理學(xué)家斯蒂芬·霍金教授所使用的聲音合成器。

上世紀(jì) 90 年代,隨著計(jì)算和存儲(chǔ)能力大幅度提升,基于大語(yǔ)料庫(kù)的單元挑選與波形拼接合成方法出現(xiàn),可以合成出高質(zhì)量的自然人語(yǔ)音。

進(jìn)入21世紀(jì),隨著深度學(xué)習(xí)技術(shù)的興起和快速發(fā)展,以語(yǔ)音合成為代表的語(yǔ)音處理技術(shù)得到了極大的飛躍。神經(jīng)網(wǎng)絡(luò)語(yǔ)音合成在近幾年來(lái)取得了顯著突破,合成?的?質(zhì)和?然度越來(lái)越?,運(yùn)?速度也越來(lái)越快。思必馳目前所使用的,也正是這種方法。

思必馳TTS,魅力何在?

早在2007年于英國(guó)劍橋大學(xué)創(chuàng)立時(shí),思必馳關(guān)于語(yǔ)音合成技術(shù)研究就已開(kāi)啟,該項(xiàng)工作由思必馳聯(lián)合創(chuàng)始人兼首席科學(xué)家、上海交通大學(xué)教授俞凱領(lǐng)頭。

語(yǔ)音合成系統(tǒng)主要分為文本處理、聲學(xué)模型、聲碼器三個(gè)部分。文本處理負(fù)責(zé)對(duì)文本進(jìn)行轉(zhuǎn)寫(xiě)和phoneme序列轉(zhuǎn)換;聲學(xué)模型使用深度神經(jīng)網(wǎng)絡(luò),可以在文本特征與聲學(xué)特征之間學(xué)習(xí)到更復(fù)雜的非線性關(guān)系;聲碼器負(fù)責(zé)將聲學(xué)模型輸出的聲學(xué)特征,通過(guò)卷積運(yùn)算,轉(zhuǎn)換成音頻。

經(jīng)過(guò)10多年的研究積累,思必馳在建模方法上,涵蓋了從傳統(tǒng)的統(tǒng)計(jì)參數(shù)模型到最新的基于神經(jīng)網(wǎng)絡(luò)的方法;對(duì)聲碼器的研究,涵蓋了從傳統(tǒng)的基于信號(hào)處理的方法到最新的基于神經(jīng)網(wǎng)絡(luò)的方法。

語(yǔ)音合成的質(zhì)量與效果,既有賴于語(yǔ)音廠商的算法模型,還取決于音頻語(yǔ)料的質(zhì)量,即數(shù)據(jù)質(zhì)量。思必馳有著豐富的聲優(yōu)資源以及聲優(yōu)挑選的經(jīng)驗(yàn),在蘇州建設(shè)有專業(yè)錄?棚并與國(guó)內(nèi)多個(gè)城市的錄?棚有著長(zhǎng)久合作關(guān)系。與此同時(shí),思必馳數(shù)據(jù)團(tuán)隊(duì)也對(duì)數(shù)據(jù)標(biāo)注有著嚴(yán)格的質(zhì)量把控。

經(jīng)過(guò)多年的技術(shù)積累,思必馳已逐步形成了?套成熟的技術(shù)?案,業(yè)務(wù)涵蓋了?數(shù)據(jù)語(yǔ)?定制、?數(shù)據(jù)快速定制、聲?克隆、歌聲合成、?語(yǔ)種合成、??合成、情感合成等,可選公有云、私有云以及離線三種部署?式,經(jīng)典??可在思必馳官?實(shí)時(shí)體驗(yàn)。

2017年、2020年,思必馳還先后參與國(guó)家標(biāo)準(zhǔn)《中文語(yǔ)音合成互聯(lián)網(wǎng)服務(wù)接口規(guī)范》與行業(yè)標(biāo)準(zhǔn)《中文語(yǔ)音合成服務(wù)系統(tǒng)評(píng)估規(guī)范》的制定,并成為全國(guó)首批通過(guò)評(píng)估測(cè)評(píng)的公司之一,獲得“TTS-4S(Standard Similarity Scene System)服務(wù)證書(shū)”。該測(cè)評(píng)從合成質(zhì)量、定制能力、場(chǎng)景表現(xiàn)力和系統(tǒng)安全可靠等維度,全面評(píng)估合成水平和服務(wù)能力。

未來(lái)世界,百“聲”爭(zhēng)鳴

為能快速提供語(yǔ)音合成定制服務(wù),思必馳全程提供音色選擇、錄音指導(dǎo)、音頻處理、模型訓(xùn)練、服務(wù)部署等專業(yè)服務(wù),賦予產(chǎn)品開(kāi)口講話的能?。

截至目前,思必馳語(yǔ)音合成已建設(shè)的??庫(kù)內(nèi)包含音色接近200個(gè),涵蓋多種??、多種風(fēng)格,以及各個(gè)年齡層次。

思必馳語(yǔ)音合成服務(wù),也已在車載、?電、機(jī)器?、智能客服等諸多領(lǐng)域成功落地,為眾多終端產(chǎn)品賦予聲的魅力,使得萬(wàn)物皆可溝通,并逐漸走入人們的工作與生活。

當(dāng)你在家里“躺平”,來(lái)自如影智能的語(yǔ)音管家“Edison”,用他溫暖、紳士的聲音(文章開(kāi)頭的音頻A),為你帶來(lái)踏實(shí)與慰藉;當(dāng)你在愛(ài)車中馳騁,車蘿卜的語(yǔ)音助理“蘿卜”清脆、簡(jiǎn)明的聲音,如同車水馬龍路途中的一股清流;當(dāng)你接起順豐95338服務(wù)熱線的外呼電話,智能客服“豐小蜜”親切又不失嚴(yán)謹(jǐn)?shù)穆曇?,配合高效的工作能力,帶給你最省心省力的服務(wù)體驗(yàn)……

鏡頭切換到泛娛樂(lè)領(lǐng)域,思必馳團(tuán)隊(duì)打造的“小馳機(jī)器人”在央視《機(jī)智過(guò)人》中,現(xiàn)場(chǎng)用撒貝寧的聲音生成了一曲《好久不見(jiàn)》。在《經(jīng)典詠流傳》中,思必馳攜手欄目組共同推出 “讀詩(shī)成曲”線上互動(dòng)小工具,提供實(shí)時(shí)讀詩(shī)成曲的能?。用戶僅需讀幾句簡(jiǎn)單的詩(shī)詞,便可快速生成有腔有韻的歌聲,互動(dòng)總量超過(guò)821萬(wàn)人次。

在個(gè)性化定制上,思必馳不僅可以提供普通話定制、歌聲定制,還可以通過(guò)遷移學(xué)習(xí)方法,提供更高難度的方言、小語(yǔ)種TTS定制,如粵語(yǔ)、上海語(yǔ)、四川話、?東話、東北話、德語(yǔ)、法語(yǔ)等。

而思必馳的情感合成技術(shù),則賦予美妙音色豐沛的情緒,讓聲音更具表現(xiàn)力與感染力。

此外,思必馳聲音復(fù)刻技術(shù)也已在斑馬智能、愛(ài)馳汽車、嵐圖汽車、仙豆智能等車聯(lián)網(wǎng)客戶以及IoT領(lǐng)域落地,僅需錄音20句話約400漢字,10分鐘之內(nèi)便可以完成模型生產(chǎn),MOS 合成音/錄音達(dá)到90%,相似度合成音/錄音達(dá)到80%。

人類的聲音,是人類語(yǔ)言的物質(zhì)外殼,卻承載著重要的信息和真摯的情感,擁有著無(wú)窮的魅力。人工智能突飛猛進(jìn)地發(fā)展正不斷催化人機(jī)交互方式的巨變,“萬(wàn)物可溝通、萬(wàn)事可打理”的語(yǔ)音互聯(lián)未來(lái)世界,正加速到來(lái)……

原文標(biāo)題:做道聽(tīng)力題,檢驗(yàn)下思必馳TTS技術(shù)

文章出處:【微信公眾號(hào):思必馳】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1814

    文章

    49949

    瀏覽量

    263585
  • 思必馳
    +關(guān)注

    關(guān)注

    4

    文章

    387

    瀏覽量

    15922

原文標(biāo)題:做道聽(tīng)力題,檢驗(yàn)下思必馳TTS技術(shù)

文章出處:【微信號(hào):思必馳,微信公眾號(hào):思必馳】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    蘇州市委書(shū)記范波一行蒞臨調(diào)研

    調(diào)研期間,范波一行來(lái)到,了解人工智能大模型場(chǎng)景研發(fā)應(yīng)用情況。
    的頭像 發(fā)表于 01-10 09:32 ?819次閱讀

    銀川市人民政府領(lǐng)導(dǎo)蒞臨調(diào)研考察

    近日,銀川市人民政府副市長(zhǎng)楊燕萍、銀川市數(shù)據(jù)局局長(zhǎng)馬鵬斐、銀川市數(shù)據(jù)局副局長(zhǎng)買小林一行蒞臨北京分公司,深入考察
    的頭像 發(fā)表于 12-12 11:30 ?751次閱讀

    任務(wù)型對(duì)話算法通過(guò)國(guó)家備案

    近日,國(guó)家網(wǎng)信辦公開(kāi)發(fā)布第十四批境內(nèi)深度合成服務(wù)算法備案信息,任務(wù)型對(duì)話算法正式通過(guò)備案。這是
    的頭像 發(fā)表于 11-20 10:33 ?782次閱讀

    聲音轉(zhuǎn)換算法通過(guò)國(guó)家備案

    近日,國(guó)家互聯(lián)網(wǎng)信息辦公室公告第十三批深度合成服務(wù)算法備案信息,聲音轉(zhuǎn)換算法通過(guò)備案,這也是
    的頭像 發(fā)表于 09-18 14:05 ?819次閱讀

    一鳴智能客服大模型通過(guò)生成式人工智能服務(wù)備案

    近日,江蘇網(wǎng)信發(fā)布新一批生成式人工智能服務(wù)備案信息,其中,由控股子公司
    的頭像 發(fā)表于 09-16 18:08 ?1110次閱讀

    8月份大事件回顧

    近日,與奧迪全新一代智能網(wǎng)聯(lián)車型合作正式量產(chǎn)落地。
    的頭像 發(fā)表于 09-03 09:07 ?850次閱讀

    空調(diào)大模型解決方案

    這不是幻想,是基于思空調(diào)大模型解決方案發(fā)生的真實(shí)體驗(yàn),該方案深度融合了自研的全鏈路智能
    的頭像 發(fā)表于 07-31 17:46 ?852次閱讀

    聲音復(fù)刻算法獲得深度合成服務(wù)算法備案

    近日,國(guó)家互聯(lián)網(wǎng)信息辦公室正式發(fā)布第十二批深度合成服務(wù)算法備案信息,聲音復(fù)刻算法通過(guò)此次備案。該算法能夠高精度復(fù)刻人類聲音,為個(gè)性化語(yǔ)音
    的頭像 發(fā)表于 07-31 17:42 ?784次閱讀

    亮相2025世界人工智能大會(huì)

    近日,2025世界人工智能大會(huì)暨人工智能全球治理高級(jí)別會(huì)議(WAIC2025)在上海盛大開(kāi)幕。本屆大會(huì)以“智能時(shí)代 同球共濟(jì)”為主題,全方位呈現(xiàn)了全球AI技術(shù)突破、產(chǎn)業(yè)變革與治理實(shí)踐的
    的頭像 發(fā)表于 07-31 17:41 ?808次閱讀

    7月份大事件回顧

    近日,聲音復(fù)刻算法通過(guò)國(guó)家互聯(lián)網(wǎng)信息辦公室第十二批深度合成服務(wù)算法備案。該算法能夠高精度復(fù)刻人類聲音,通過(guò)少量的錄音訓(xùn)練得到極為相似的聲音模型,快速“克隆”個(gè)性化的聲音,為
    的頭像 發(fā)表于 07-28 17:52 ?724次閱讀

    宣布,再獲新一輪融資

    自主品牌在辦公會(huì)議場(chǎng)景的深度創(chuàng)新、推動(dòng)產(chǎn)品迭代與升級(jí)。 ? 成立于2007年,是國(guó)內(nèi)領(lǐng)先的對(duì)話式人工智能平臺(tái)公司。自創(chuàng)立以來(lái),
    的頭像 發(fā)表于 06-26 01:09 ?3881次閱讀

    何維率一行蒞臨調(diào)研

    現(xiàn)場(chǎng),董事長(zhǎng)、CEO高始興介紹了的業(yè)務(wù)布局與落地應(yīng)用情況。
    的頭像 發(fā)表于 04-24 15:36 ?749次閱讀

    出席語(yǔ)言計(jì)算技術(shù)創(chuàng)新專題研討會(huì)

    近日,與東南大學(xué)蘇州校區(qū)聯(lián)合舉辦語(yǔ)言計(jì)算技術(shù)創(chuàng)新專題研討暨校企合作洽談會(huì)。
    的頭像 發(fā)表于 04-17 15:42 ?619次閱讀

    柳州市領(lǐng)導(dǎo)蒞臨調(diào)研考察

    創(chuàng)新成果落地等主題開(kāi)展專題調(diào)研。此次調(diào)研聚焦思智能語(yǔ)音交互、大模型技術(shù)融合及產(chǎn)業(yè)鏈協(xié)同等領(lǐng)域的發(fā)展成效,并深入了解企業(yè)需求,鼓勵(lì)企業(yè)加
    的頭像 發(fā)表于 03-24 16:37 ?1160次閱讀

    亮相2025年蘇州市“人工智能+”創(chuàng)新發(fā)展推進(jìn)大會(huì)

    近日,2025年蘇州市“人工智能+”創(chuàng)新發(fā)展推進(jìn)大會(huì)暨人工智能賦能新型工業(yè)化深度行(蘇州站)活動(dòng)隆重舉行,專家學(xué)者、產(chǎn)業(yè)大咖、金融精英齊聚蘇州,共商“人工智能+”融合創(chuàng)新。作為人工智能
    的頭像 發(fā)表于 02-17 16:16 ?959次閱讀