chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達GPU+超大規(guī)模推理平臺助推動AI交互技術(shù)應用全面爆發(fā)

牽手一起夢 ? 來源:金準數(shù)據(jù) ? 作者:金準數(shù)據(jù) ? 2020-06-03 15:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

前言

隨著AI技術(shù)的爆發(fā)和發(fā)展,智能語音技術(shù)已逐漸成為人們生活中最普遍的AI交互技術(shù)之一。

事實上,語言作為維系人與人之間情感和交際的重要紐帶,一直以不同的承載形式為人們所用。例如在搜狗以語言為核心的AI技術(shù)布局中,從中文、多方言和外國語種的語音識別轉(zhuǎn)寫、AI同傳翻譯,再到個性化的語音合成和變聲……在人們生活中語言應用的方方面面,都不乏搜狗的身影。

如今,搜狗作為國產(chǎn)AI+語音領(lǐng)域顛覆傳統(tǒng)語音行業(yè)領(lǐng)先者之一,其AI語音技術(shù)具有高識別率、高準確率、低時延和多模態(tài)融合等優(yōu)勢,已廣泛應用到教育、商務、旅游等多個應用場景,并已深入你我身邊的千家萬戶中。

其中,搜狗語音識別準確率最高可達98%,語音日均請求量已達十億級,尤其在錄音筆行業(yè),其搜狗輸入法通過AI賦能,也已為市場超90%的錄音筆提供接入服務。

金準產(chǎn)業(yè)研究專家發(fā)現(xiàn),在搜狗AI技術(shù)體系一次次引領(lǐng)行業(yè)創(chuàng)新,顛覆傳統(tǒng)行業(yè)生態(tài)的背后,是搜狗AI算法平臺和深度學習平臺Eva搭建起的“骨架”。而AI平臺和深度學習框架的背后,強大的算力平臺也助力其構(gòu)筑起了語音領(lǐng)域的強大的競爭力和領(lǐng)先性。

一、國內(nèi)AI語音行業(yè)先鋒,語音處理日請求量超十幾億次

2020年開年以來,新型冠狀肺炎病毒疫情一直影響著國內(nèi)市場的復工和發(fā)展,但陳偉帶領(lǐng)的搜狗AI交互技術(shù)團隊在科研領(lǐng)域的技術(shù)應用和研究,并沒有受到影響而減緩。

搜狗在AI領(lǐng)域始終堅持的就是以語言為核心。搜狗AI交互事業(yè)部團隊,核心解決的問題則是圍繞自然交互領(lǐng)域,讓人機交互更加自然,尤其是多模態(tài)的交互。

實際上,搜狗以語言為核心的AI技術(shù)主要布局自然交互和知識計算兩大賽道。

搜狗AI主要通過語音和圖像的感知、對話、翻譯等來實現(xiàn)人與計算機之間的交互;另一方面,知識計算則更多地圍繞基于海量的網(wǎng)絡數(shù)據(jù)或已有數(shù)據(jù),通過搜索和自然語言處理(NLP),從中抽取出真正的知識以解決問題。

從2012年起,隨著搜狗開始投入智能語音技術(shù)的研發(fā),其AI團隊規(guī)模已發(fā)展至將近1000人。

而在搜狗AI體系構(gòu)建的背后,有一個名為Eva的搜狗深度學習平臺則發(fā)揮了關(guān)鍵作用。

在深度神經(jīng)網(wǎng)絡建立之前,搜狗的每一項技術(shù)如語音合成和語音識別,是兩個獨立的方向。但在Eva構(gòu)建之后,從底層的模型架構(gòu)到算法設計等方面都形成了一個端到端的有機整體。

通俗地說,就是它能夠?qū)⒄Z音、圖像、NLP等技術(shù)集成在一起,為研發(fā)人員統(tǒng)一提供深度學習模型的訓練。

由于最初的模型和算法并不復雜,搜狗一開始的深度神經(jīng)網(wǎng)絡仍然依靠CPU來運行。但隨著數(shù)據(jù)的增長和算法復雜度的提升,模型訓練的數(shù)據(jù)規(guī)模十分龐大,CPU早已無法滿足深度神經(jīng)網(wǎng)絡的訓練需求。

例如,在語音模型訓練過程中,動輒需要十幾萬小時的數(shù)據(jù)。就算用數(shù)十塊英偉達GPU來進行訓練,也需要數(shù)月的時間才能完成。

因此,隨著深度神經(jīng)網(wǎng)絡并行計算需求的增加,以及模型愈發(fā)復雜,搜狗從2013年后開始逐漸探索用GPU來對模型進行訓練,以持續(xù)迭代線上的AI服務性能。據(jù)了解,基于英偉達強大的GPU算力支持,目前搜狗語音的日均請求量已達十億以上。

二、英偉達GPU+超大規(guī)模推理平臺,助力搜狗AI語音兩大創(chuàng)新方向

而在搜狗強大AI交互技術(shù)過程中,英偉達T4和Tensor RT為搜狗實現(xiàn)算力突破,創(chuàng)新行業(yè)提供了強勁的技術(shù)支持。

在陳偉看來,英偉達GPU在訓練和推理兩個方向都提供了強大的算力支持。

一是面向線下的模型訓練,需要GPU具有充分強大的算力和足夠的顯存,以驅(qū)動模型基于大數(shù)據(jù)的訓練,如目前使用的Tesla V100和P40;二是面向線上的推理和部署,這對GPU顯存和算力的需求相對較小,適合對大規(guī)模海量計算機進行部署,如Tesla P4和T4。

其中,T4 GPU專為優(yōu)化和提升AI性能而打造,配備了英偉達Turning Tensor核心,能夠在實現(xiàn)高效算力的同時,進一步支持服務器實現(xiàn)AI訓練和推理的橫向擴展。

T4 GPU具有三大性能優(yōu)勢。一是其能夠優(yōu)化可擴展服務器,能效高出CPU的50倍以上,大大降低運營成本;二是它具有多精度計算特性,可實現(xiàn)FP32、FP16到INT8以及INT4精度的突破性AI性能,其訓練性能達到CPU的9.3倍,推理性能超36倍;三是它能夠加速深度學習和機器學習的訓練、推理、視頻解碼和虛擬桌面,并支持所有AI框架和網(wǎng)絡模型,進一步提高大規(guī)模部署的效用。

此外,搜狗在使用GPU推理的過程中,還利用了英偉達超大規(guī)模推理平臺Tensor RT,以加速深度神經(jīng)網(wǎng)絡的推理。

據(jù)金準產(chǎn)業(yè)研究團隊了解,Tensor RT超大規(guī)模推理平臺是英偉達專為全球開發(fā)者和數(shù)據(jù)科學家們開發(fā),其配備了英偉達T4 GPU,能夠加速圖像、語音、翻譯和推薦系統(tǒng)等廣泛領(lǐng)域的神經(jīng)網(wǎng)絡。同時,它還支持加速業(yè)內(nèi)各大主流的深度學習框架,例如TensorFlow、PyTorch、MXNet、Chainer和Caffe2。

好的算法和龐大的數(shù)據(jù),一定需要好的運算平臺。英偉達的GPU和AI推理平臺為搜狗AI技術(shù)體系的構(gòu)建,提供了批量運算或并行運算的能力,并逐漸形成良好的開發(fā)生態(tài)。

三、T4加持,語音識別準確率高達98%

如今,搜狗在自然交互和知識計算兩個AI戰(zhàn)略方向上,布局了語音、計算機視覺、對話、翻譯、問答多個領(lǐng)域,并在搜狗分身、搜狗同傳、搜狗變聲等多個差異化賽道持續(xù)領(lǐng)跑,對算力需求進一步提升。

隨著搜狗語音識別、多模態(tài)識別(語音+唇語)、OCR、機器翻譯、語音合成、圖像生成等應用場景和需求的擴展,它們對算力資源的需求是根據(jù)不同任務而定的。搜狗的多模態(tài)識別服務,是將語音和唇語的兩個模態(tài)融合后再進行識別,而這一多模態(tài)感知的方式也使得模型對運算的要求更加復雜。

金準產(chǎn)業(yè)研究團隊認為,AI語音領(lǐng)域?qū)\算的需求只會越來越大。盡管近幾年語音識別顛覆性的創(chuàng)新和突破越來越少,但現(xiàn)有技術(shù)還在持續(xù)迭代中,模型本身的學習能力也將不斷加強。

與此同時,隨著5G、IoT技術(shù)的推動,大數(shù)據(jù)也在急劇爆發(fā)和增長,這對于AI公司來說無疑意味著更復雜的模型和更龐大的訓練數(shù)據(jù),從而對GPU的算力提出了更高要求。

在搜狗的語音轉(zhuǎn)寫應用中,語音識別準確率是影響用戶體驗和應用的重要因素之一。

金準產(chǎn)業(yè)研究團隊了解到,目前搜狗語音輸入法在業(yè)內(nèi)具有領(lǐng)先的中英自由說能力、遠場語音識別解決方案,以及業(yè)界首創(chuàng)的語音修改能力。例如,搜狗語音輸入法能識別日韓英法等10余種外語和粵川等10種方言,支持語音增強和個性化交互,同時其語音識別準確率最高為98%,日均語音輸入調(diào)用次數(shù)突破十億次。

實際上,搜狗語音識別準確率的提升,主要依靠算力、深度學習技術(shù)和語料數(shù)據(jù)訓練。在算力方面,搜狗從2017年起開始采用英偉達Tesla P4來加速和優(yōu)化語音識別模型。

早在2017年,搜狗通過P4的并行計算推理速度,將語音識別請求效率提升50%。在之后的兩年時間里,隨著Cuda升級至9.1以及算力的持續(xù)優(yōu)化,搜狗的語音識別請求效率不斷提升。2019年11月,搜狗將P4升級至T4后效率再度實現(xiàn)突破,提升20%。

伴隨著引進T4 GPU,其語音識別峰值日均調(diào)用量也從2017年的3.2億次,迅速增長到了2019年第三季度的8.3億次,有效實現(xiàn)了對海量識別請求的處理,進一步強化了自身語音識別技術(shù)的潛力,為行業(yè)創(chuàng)新和變革提供了新的發(fā)展方向。

四、T4優(yōu)化WaveRNN聲碼器,推動源技術(shù)從學界落地產(chǎn)業(yè)

除了語音識別之外,語音合成亦是檢驗語音技術(shù)公司實力的標準之一。

搜狗語音合成支持男女多風格和中英俄多語種共數(shù)十種音色,同時系統(tǒng)只需用戶上傳5分鐘的音頻,即可生成該說話人的音色,甚至能實現(xiàn)說話人的風格遷移。

技術(shù)方面,搜狗的語音合成技術(shù)基于WaveNet和WaveRNN聲碼器研發(fā),但由于WaveNet運算復雜度較高,因此它最初很難實現(xiàn)搜狗線上實時生成語音的服務。

為了優(yōu)化WaveRNN聲碼器,搜狗一方面在WaveRNN源技術(shù)論文的基礎(chǔ)上進行了大量的研究工作,并為了實用化修改大量代碼結(jié)構(gòu);另一方面則基于T4對WaveRNN進行優(yōu)化,并定制開發(fā)實現(xiàn)的gemm算子,進一步降低了語音合成的實時解碼率。

搜狗通過T4的優(yōu)化性能,也進一步打破學界與產(chǎn)業(yè)之間的遷移壁壘,真正實現(xiàn)國內(nèi)語音行業(yè)首創(chuàng),讓WaveRNN聲碼器技術(shù)更好地服務AI語音行業(yè)的創(chuàng)新和發(fā)展。

不僅如此,隨著搜狗AI交互技術(shù)開始涉及更多圖像相關(guān)的應用,如虛擬人、OCR、手寫識別、唇語識別、圖像以及視頻生成等,其深度學習平臺對高可用、并行訓練服務能力的需求亦進一步提升。

例如,在搜狗AI平臺對外開放的過程中,會有大量的用戶涌入,基于平臺進行訓練并定制自己的模型,而在這一過程中,搜狗AI平臺需要在任務之間做好排隊調(diào)度,并充分考慮GPU的負載均衡等問題。

因此從平臺層面看,搜狗的服務會通過AI開放平臺借助深度學習的能力,去幫助更多的用戶實現(xiàn)定制化AI的可能性。

值得一提的是,隨著英偉達Tensor RT7的推出,目前搜狗也開始在部分任務上嘗試使用該平臺。金準產(chǎn)業(yè)研究團隊預測,未來,隨著搜狗AI技術(shù)和業(yè)務的迭代和創(chuàng)新,也會將Tensor RT7逐步引入到更多任務中。

五、高算力GPU助推語音交互和AI計算平臺未來發(fā)展

如今,搜狗在AI語音聽寫方面,已與愛國者、紐曼、索尼、萬城四家錄音筆行業(yè)頭部企業(yè)成立AI創(chuàng)新聯(lián)盟,聯(lián)合搜狗輸入法為市場超90%的錄音筆提供接入服務。

除此之外,搜狗通過語音+唇語的多模態(tài)識別技術(shù)研發(fā)唇語識別系統(tǒng),嘈雜環(huán)境下識別準確率提升40%以上,同時搜狗還通過搜狗翻譯、合成和識別等技術(shù),在跨語言交流、機器同傳等多個應用領(lǐng)域拿下行業(yè)領(lǐng)先的成績。

未來,隨著AI交互技術(shù)應用范圍的不斷擴展,搜狗也將針對搜狗AI開放平臺、多模態(tài)技術(shù)融合等方面進行升級。

搜狗將借助AI開放平臺加速推動AI核心能力對外開放;語音識別和語音合成兩方面,包括個性化語音合成、語音變聲、多模態(tài)交互、手寫識別、多模態(tài)同傳等技術(shù)也將帶來更多的體驗創(chuàng)新和升級。

從內(nèi)部看,搜狗也將真正打通各個研究團隊在GPU資源上的共享能力,并基于平臺為公司提供一個相對通用的、統(tǒng)一的一套深度學習的并行訓練能力。

而這些由內(nèi)而外的技術(shù)升級,也將對GPU性能產(chǎn)生更大的需求。

不僅僅是對GPU算力需求的增強,同時也需要GPU能夠為我們提供更豐富的配套服務。英偉達已逐漸打造了一個良好的AI生態(tài),而搜狗作為生態(tài)的一份子,同樣也希望它能夠在生態(tài)上進一步支持搜狗的自身業(yè)務,繼續(xù)助力搜狗AI技術(shù)的創(chuàng)新發(fā)展。

結(jié)語:AI交互技術(shù)應用全面爆發(fā),GPU助力催化行業(yè)創(chuàng)新

語言的多模態(tài)應用,不知不覺間已成為人們生活中習以為常的技術(shù),一句簡單的語音識別轉(zhuǎn)寫、一次跨語種的同傳翻譯……這些都是AI交互技術(shù)應用在全面爆發(fā)的過程中,為人們生活帶來的便利。

而在這些便利技術(shù)背后所催生的巨大算力需求,也為包括搜狗在內(nèi)的許多企業(yè)提出了新的技術(shù)挑戰(zhàn)。而搜狗通過借助強大的GPU計算平臺,不僅突破了龐大AI計算負載給AI語音帶來的算力瓶頸,亦為搜狗在AI語音領(lǐng)域的創(chuàng)新發(fā)展提供了重要的算力支持。

面對海量的數(shù)據(jù)分析請教,以及比以往更復雜的模型訓練。在這一背景下,AI技術(shù)公司如何開拓并尋找更優(yōu)質(zhì)的技術(shù)支撐,對自身的基礎(chǔ)設施進行更好的優(yōu)化和提升,亦是每一家公司在AI落地和應用過程中需要考量的。

責任編輯:gt

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4948

    瀏覽量

    131253
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35164

    瀏覽量

    280007
  • 英偉達
    +關(guān)注

    關(guān)注

    22

    文章

    3953

    瀏覽量

    93799
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    信而泰×DeepSeek:AI推理引擎驅(qū)動網(wǎng)絡智能診斷邁向 “自愈”時代

    學習、大規(guī)模數(shù)據(jù)分析等前沿技術(shù)。DeepSeek-R1具備卓越的邏輯推理、多模態(tài)分析(文本/圖像/語音)和實時交互能力,能夠高效處理代碼生成、復雜問題求解、跨模態(tài)學習等高階任務。憑借其
    發(fā)表于 07-16 15:29

    偉創(chuàng)力高效電源模塊在超大規(guī)模數(shù)據(jù)中心的應用

    受云端存儲和數(shù)據(jù)處理需求持續(xù)增長的推動,數(shù)據(jù)中心正以前所未有的速度擴張。當前全球超大規(guī)模數(shù)據(jù)中心,即規(guī)模最大的那些數(shù)據(jù)中心,總?cè)萘吭谶^去四年內(nèi)翻了一番,并仍在不斷增長。
    的頭像 發(fā)表于 07-07 15:41 ?367次閱讀

    超大規(guī)模芯片驗證:基于AMD VP1902的S8-100原型驗證系統(tǒng)實測性能翻倍

    引言隨著AI、HPC及超大規(guī)模芯片設計需求呈指數(shù)級增長原型驗證平臺已成為芯片設計流程中驗證復雜架構(gòu)、縮短迭代周期的核心工具。然而,傳統(tǒng)原型驗證系統(tǒng)受限于單芯片容量(通常
    的頭像 發(fā)表于 06-06 13:13 ?530次閱讀
    <b class='flag-5'>超大規(guī)模</b>芯片驗證:基于AMD VP1902的S8-100原型驗證系統(tǒng)實測性能翻倍

    CMOS超大規(guī)模集成電路制造工藝流程的基礎(chǔ)知識

    本節(jié)將介紹 CMOS 超大規(guī)模集成電路制造工藝流程的基礎(chǔ)知識,重點將放在工藝流程的概要和不同工藝步驟對器件及電路性能的影響上。
    的頭像 發(fā)表于 06-04 15:01 ?700次閱讀
    CMOS<b class='flag-5'>超大規(guī)模</b>集成電路制造工藝流程的基礎(chǔ)知識

    納微半導體推出12kW超大規(guī)模AI數(shù)據(jù)中心電源

    近日,納微半導體宣布推出專為超大規(guī)模AI數(shù)據(jù)中心設計的最新12kW量產(chǎn)電源參考設計,可適配功率密度120kW的高功率服務器機架。
    的頭像 發(fā)表于 05-27 16:35 ?569次閱讀

    AI原生架構(gòu)升級:RAKsmart服務器在超大規(guī)模模型訓練中的算力突破

    近年來,隨著千億級參數(shù)模型的崛起,AI訓練對算力的需求呈現(xiàn)指數(shù)級增長。傳統(tǒng)服務器架構(gòu)在應對分布式訓練、高并發(fā)計算和顯存優(yōu)化等場景時逐漸顯露瓶頸。而RAKsmart為超大規(guī)模模型訓練提供了全新的算力解決方案。
    的頭像 發(fā)表于 04-24 09:27 ?299次閱讀

    DeepSeek推動AI算力需求:800G光模塊的關(guān)鍵作用

    隨著人工智能技術(shù)的飛速發(fā)展,AI算力需求正以前所未有的速度增長。DeepSeek等大模型的訓練與推理任務對算力的需求持續(xù)攀升,直接推動了服務器、光通信設備以及數(shù)據(jù)中心基礎(chǔ)設施的升級。特
    發(fā)表于 03-25 12:00

    IBM攜手英偉AI數(shù)據(jù)平臺推動企業(yè)級AI創(chuàng)新

    近日,IBM(紐約證券交易所:IBM)宣布與英偉(納斯達克股票代碼:NVDA)開展全新合作,雙方將基于英偉 AI 數(shù)據(jù)
    發(fā)表于 03-24 19:20 ?240次閱讀

    英偉GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代

    英偉GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代
    的頭像 發(fā)表于 03-20 15:35 ?733次閱讀

    偉創(chuàng)力如何應對超大規(guī)模數(shù)據(jù)中心建設挑戰(zhàn)

    在當今瞬息萬變的數(shù)字世界中,數(shù)據(jù)中心正面臨著前所未有的挑戰(zhàn)。隨著人工智能(AI)的迅速崛起,傳統(tǒng)的數(shù)據(jù)中心設計與運營模式遭遇了巨大壓力。偉創(chuàng)力通信、企業(yè)和云業(yè)務總裁Rob Campbell 指出,超大規(guī)模數(shù)據(jù)中心建設面臨獨特挑戰(zhàn),傳統(tǒng)運營模式亟待革新。
    的頭像 發(fā)表于 03-06 13:58 ?474次閱讀

    Inflection AI轉(zhuǎn)向英特爾Gaudi 3,放棄英偉GPU

    近日,人工智能技術(shù)公司Inflection AI宣布了一項重要決策,其最新的企業(yè)平臺將放棄采用英偉(Nvidia)的
    的頭像 發(fā)表于 10-10 17:21 ?777次閱讀

    Zettabyte與緯創(chuàng)攜手打造臺灣首個超大規(guī)模AI數(shù)據(jù)中心

    推動亞太地區(qū)AI計算領(lǐng)域邁向新紀元的征程中,Zettabyte與緯創(chuàng)資通(Wistron Corporation)攜手宣布了一項重大合作——共同建設臺灣地區(qū)首個超大規(guī)模AI數(shù)據(jù)中心,
    的頭像 發(fā)表于 09-05 16:26 ?794次閱讀

    谷歌正在考慮在越南建設超大規(guī)模數(shù)據(jù)中心

    據(jù)可靠消息透露,Alphabet集團旗下的谷歌公司正積極籌劃在越南南部的經(jīng)濟樞紐胡志明市周邊建設一座“超大規(guī)模”數(shù)據(jù)中心。此舉標志著美國科技巨頭首次在東南亞國家進行此類重大投資,盡管具體的投資金額尚待揭曉。
    的頭像 發(fā)表于 08-30 14:55 ?1023次閱讀

    SAS 24G+規(guī)范發(fā)布,為超大規(guī)模數(shù)據(jù)中心HDD和SSD

    在當前超大規(guī)模數(shù)據(jù)中心的演進歷程中,盡管固態(tài)硬盤正日益向支持NVMe協(xié)議的PCIe接口轉(zhuǎn)型,但串行連接SCSI(SAS)技術(shù)依然是眾多關(guān)鍵應用不可或缺的支柱。SAS存儲技術(shù)的生命力遠未枯竭,這一點從
    的頭像 發(fā)表于 07-25 15:13 ?1299次閱讀

    英偉全面轉(zhuǎn)向開源GPU內(nèi)核模塊

    英偉公司近期宣布了一項重大決策,即全面轉(zhuǎn)向開源GPU內(nèi)核模塊,并計劃最終以此取代閉源驅(qū)動程序。這一戰(zhàn)略轉(zhuǎn)變標志著英偉
    的頭像 發(fā)表于 07-19 15:26 ?899次閱讀