chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA助力阿里巴巴天貓精靈大幅提升服務運行效率

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 作者:NVIDIA英偉達企業(yè)解 ? 2022-07-14 10:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

天貓精靈智能引擎團隊、智能合成團隊與 NVIDIA 團隊合作,通過利用 NVIDIA TensorRT 加速流式語音合成(Text-to-Speech,以下簡稱 TTS)深度學習模型,并借助 NVIDIA Triton 推理服務器在 NVIDIA T4 GPU 上進行高效部署,幫助阿里巴巴天貓精靈流式 TTS 服務將吞吐提升 50%,首包延時降低 35%,大幅提升服務運行效率,提升資源利用率。

天貓精靈(Tmall Genie)是阿里巴巴消費者人工智能一級公司,于 2017 年 9 月發(fā)布第一代天貓精靈智能終端 X1。讓用戶以自然語言對話的交互方式,實現(xiàn)影音娛樂、購物、信息查詢、生活服務等功能操作,成為消費者的家庭助手。目前,天貓精靈已經服務超過 3000 萬中國家庭,在三方權威統(tǒng)計中不僅智能音箱產品出貨量排名中國前列,其產品并已可連接 3 億以上的家庭 AIoT 生態(tài)設備。

除了智能音箱終端產品外,天貓精靈推出 AliGenie 開放平臺,旨在構建基于 AI 的多模態(tài)交互及服務系統(tǒng),為多種云應用提供跨系統(tǒng)服務能力,實現(xiàn)端云協(xié)同、跨平臺多終端快速接入。該開放平臺提供高性能且高質量的語音 AI 能力,包括多種不同音色的高度擬人、高度流暢的語音合成算法等。

此外,天貓精靈基于 AliGenie 開放平臺,還提供基于芯片/模組的硬件解決方案,以及通用的熱門行業(yè)解決方案。專注生活多個領域,提供一站式解決方案。

本案例中負責實施的是天貓精靈智能引擎團隊以及天貓精靈智能合成團隊。天貓精靈智能合成團隊負責語音合成等生成式算法的研究及開發(fā);天貓精靈智能引擎團隊主要支撐天貓精靈業(yè)務線各項業(yè)務的工程化落地,如語音識別、語義理解、語音合成、圖像處理等 AI 核心場景。

流式 TTS 是天貓精靈工作流中最為重要的 AI 環(huán)節(jié)之一。在這一場景中,天貓精靈智能引擎團隊面臨著如下挑戰(zhàn):

首先流式 TTS 對于首包延時有著嚴格要求,否則用戶將會因為較長的反饋遲滯而感到不適,這就要求 TTS 工作管線的每個模塊的推理能夠高效地執(zhí)行。

另一方面,團隊希望 TTS 服務的吞吐能夠達到較高水平,這就需要在服務端對收到的多個流式合成請求進行 Batching 的處理。但流式 TTS 工作管線包含聲學模型和聲碼器等多個模塊,在 GPU 上進行 Batching 操作需要正確維護和切換每個合成請求所需的模型狀態(tài),因此需要特別設計工作管線和調度邏輯。

最后,如何盡可能提升 GPU 資源利用率是降本增效的關鍵。最直接的思路便是在一張 GPU 上部署多個模型來提升利用率。因此,如何在同一張 GPU 上對多個模型進行高效的調度和管理也成為了一個挑戰(zhàn)。

基于以上挑戰(zhàn),天貓精靈智能引擎團隊、智能合成團隊與 NVIDIA 解決方案架構團隊合作,采用NVIDIA TensorRT對模型進行推理加速,并利用NVIDIA Triton 推理服務器在 T4 GPU 上進行在線部署,形成了一套高效的流式 TTS 推理部署方案。在提升用戶體驗的同時,大幅降低了服務成本。

首先,該方案使用 TensorRT 對流式 TTS 工作管線中的每一個模型進行優(yōu)化加速。我們將訓練好的聲學模型和聲碼器,導出為 ONNX 模型格式,再使用 TensorRT 將 ONNX 模型轉換為最優(yōu)化的 TensorRT Engine。使用 TensorRT 加速的 TTS 模型,能顯著提升推理執(zhí)行的速度,從而盡可能壓縮首包延時。

另一方面,天貓精靈智能引擎團隊與 NVIDIA 團隊合作設計并實現(xiàn)了一種基于 Triton 的流式 TTS 推理部署管線。在該方案中,我們使用 Triton Custom Backend 實現(xiàn)串聯(lián) TTS 各個模型的調度管線。對于管線中的每一步推理處理,會調用部署在 Triton 上的 TTS TensorRT Engine。如此一來,Triton 便可將發(fā)送到服務端的 TTS 請求,有條不紊地調度到管線中的每個模塊進行推理執(zhí)行。并且,在該管線中,我們實現(xiàn)了適用于 GPU 平臺的流式 TTS 高效調度機制,通過在服務端 Custom Backend 中維護每個合成請求的狀態(tài),實時地將模型輸入和狀態(tài)動態(tài)聚合為對 GPU 友好的 Batch,交由管線中各個模塊的 TensorRT Engine 進行推理,從而大幅提升管線吞吐和 GPU 利用率,同時保證了對每個合成請求的快速響應。此外,流式 TTS 中一句話的合成請求會對應多個回包,每個回包承載一個音頻塊。針對這種一收多發(fā)的推理模式,我們利用 Triton 提供的 Decoupled Responses 機制,保證一個請求的多個回包能夠正確高效地發(fā)送給對應的客戶端,使用戶能聽到完整且流暢的音頻。

最后,為了進一步提升 GPU 資源利用率,該方案利用了 Triton 的 Concurrent Model Execution 特性。該特性將部署在 Triton 上的模型或模塊,以模型實例的方式管理:一個模型可以部署多個實例,不同模型的實例也可部署在同一GPU上。因此該方案開啟了 Concurrent Model Execution 后,同一個 T4 GPU 上可部署多個 TTS 發(fā)音模型,使得多個模型實例的推理在 GPU 算力資源充足時可以達到并行執(zhí)行。如此一來,GPU 算力資源可以被多個模型的并行執(zhí)行充分利用起來,達到降本增效的目的。

通過使用基于 NVIDIA TensorRT 和 Triton 推理服務器的流式 TTS 推理部署方案,天貓精靈 TTS 服務的吞吐提升約 50%,首包延時降低約 35% ,幫助天貓精靈節(jié)省了業(yè)務成本,提升了用戶體驗。

審核編輯:湯梓紅
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5430

    瀏覽量

    108202
  • 阿里巴巴
    +關注

    關注

    7

    文章

    1642

    瀏覽量

    48765
  • TTS
    TTS
    +關注

    關注

    0

    文章

    57

    瀏覽量

    11350
  • 天貓精靈
    +關注

    關注

    4

    文章

    96

    瀏覽量

    11907

原文標題:NVIDIA TensorRT 和 Triton 助力阿里巴巴天貓精靈顯著提升流式語音合成服務運行效率

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    博世與阿里巴巴集團深化戰(zhàn)略合作

    9月2日,全球領先的汽車技術與服務商博世與阿里巴巴集團宣布深化戰(zhàn)略合作伙伴關系,以先進的云計算與人工智能技術加速推動企業(yè)數(shù)字化轉型。雙方將重點聚焦云端驅動的企業(yè)運營、AI賦能的業(yè)務創(chuàng)新,以及電商領域的拓展。
    的頭像 發(fā)表于 09-02 16:09 ?345次閱讀

    阿里云是什么?企業(yè)不可不知的云端架構服務!

    阿里云是什么?中國高速連線阿里云 CDN 服務 阿里云為國內云端市場中市占有率第一的云平臺,由阿里巴巴集團自主研發(fā),在國內使用的線路品質穩(wěn)定
    的頭像 發(fā)表于 03-16 09:43 ?1032次閱讀

    阿里云爆發(fā)式的跨越

    表示,阿里巴巴與蘋果的合作,將不僅僅局限于手機服務領域,未來還將涉及更多的業(yè)務板塊。 當媒體都在驚嘆與討論蘋果為什么選擇阿里巴巴時,背后真正的主角還需要加上一個 “云” 字。 長期以來,相比淘寶、
    的頭像 發(fā)表于 03-12 16:54 ?550次閱讀
    <b class='flag-5'>阿里</b>云爆發(fā)式的跨越

    Arm與阿里巴巴合作加速端側多模態(tài)AI體驗

    Arm 控股有限公司(納斯達克股票代碼:ARM,以下簡稱“Arm”)近日發(fā)布與阿里巴巴集團輕量級深度學習框架 MNN 的又一新合作。
    的頭像 發(fā)表于 03-10 09:07 ?905次閱讀

    谷景阿里巴巴國際站正式上線

    在行業(yè)發(fā)展的關鍵節(jié)點,谷景電子取得了重大突破,谷景阿里巴巴國際站正式上線!此次上線聚焦電感領域,旨在為全球客戶提供更較大好的電感產品與服務,也標志著谷景電感業(yè)務在國際化道路上邁出了關鍵一步。
    的頭像 發(fā)表于 02-26 09:44 ?633次閱讀

    阿里巴巴Qwen大模型助力開發(fā)低成本DeepSeek替代方案

    近日,阿里巴巴的開源Qwen2.5模型在AI領域再次展現(xiàn)其強大實力,為斯坦福大學與伯克利大學的研究人員提供了低成本的AI訓練解決方案。借助這一技術,兩所知名學府的研究團隊成功開發(fā)出價格低于50美元
    的頭像 發(fā)表于 02-12 13:42 ?1170次閱讀

    阿里巴巴否認投資DeepSeek傳聞

    近日,市場流傳出一則消息,稱阿里巴巴計劃向人工智能企業(yè)DeepSeek投資10億美元,意在獲取該公司10%的股份,并考慮將阿里云作為其首要推理算力平臺。此消息一出,立即引起了市場的廣泛關注和熱議
    的頭像 發(fā)表于 02-10 09:10 ?762次閱讀

    阿里巴巴否認投資DeepSeek

    近日,有傳聞稱阿里巴巴計劃以100億美元的估值,投資10億美元認購中國AI初創(chuàng)企業(yè)DeepSeek的10%股權。然而,阿里高管顏喬迅速對此進行了否認,他表示:“同為中國杭州企業(yè),我們?yōu)镈eepSeek的成就鼓掌,但外界流傳的阿里
    的頭像 發(fā)表于 02-08 16:47 ?840次閱讀

    貓精靈與夸克團隊攜手設計AI眼鏡

    近日,阿里巴巴集團內部的智能互聯(lián)事業(yè)群迎來了新的管理變革,由總裁吳嘉正式接管這一關鍵業(yè)務板塊。作為阿里巴巴面向廣大消費者的重要硬件業(yè)務之一,“貓精靈”將繼續(xù)保持其獨立運營的特色與優(yōu)勢
    的頭像 發(fā)表于 01-20 10:28 ?2295次閱讀

    阿里AI To C業(yè)務調整:貓精靈與夸克融合,探索AI眼鏡

    近日,阿里集團內部進行了一次業(yè)務調整,智能互聯(lián)事業(yè)群正式由智能信息事業(yè)群總裁吳嘉接管。智能互聯(lián)事業(yè)群是阿里在2022年成立的一級業(yè)務部門,其核心品牌為貓精靈,是
    的頭像 發(fā)表于 01-17 10:16 ?983次閱讀

    阿里巴巴出售高鑫零售股權,聚焦核心業(yè)務

    近日,阿里巴巴集團正式對外發(fā)布公告,宣布其子公司及New Retail與德弘資本達成了一項重要協(xié)議。根據該協(xié)議,阿里巴巴將出售其所持有的高鑫零售全部股權,這些股權合計占高鑫零售已發(fā)行股份總數(shù)的約
    的頭像 發(fā)表于 01-02 10:54 ?609次閱讀

    阿里巴巴74億出售銀泰百貨予雅戈爾

    近日,電子商務巨頭阿里巴巴集團宣布了一項重大決策,決定將旗下銀泰百貨的全部股權轉讓給由雅戈爾集團與銀泰管理團隊聯(lián)合組成的財團。這一消息引起了業(yè)界的廣泛關注。 據悉,此次交易涉及的金額高達74億元
    的頭像 發(fā)表于 12-18 10:04 ?601次閱讀

    阿里巴巴將在美國推出AI電商工具PIC COPILOT

    人工智能領域的一次重要嘗試,旨在利用先進的AI技術為美國電商市場提供更加智能化、便捷化的服務。該工具將深度融合阿里巴巴在大數(shù)據、云計算以及電子商務領域的深厚積累,通過智能算法和數(shù)據分析,幫助商家更加精準地把握市場需求,提升運營
    的頭像 發(fā)表于 12-06 10:52 ?1271次閱讀

    阿里巴巴整合電商資源,成立全新電商事業(yè)群

    業(yè)群將由蔣凡擔任CEO,直接向吳泳銘匯報。該事業(yè)群將全面覆蓋并整合阿里巴巴旗下的淘寶貓集團、國際數(shù)字商業(yè)集團,以及1688、閑魚等核心電商業(yè)務。這一整合舉措旨在打造一個覆蓋國內外全產業(yè)鏈的綜合性業(yè)務集群,進一步提升
    的頭像 發(fā)表于 11-22 10:51 ?648次閱讀

    阿里巴巴國際站首推全流程AI產品

    近日,阿里巴巴國際站正式推出了其首個全流程AI產品——AI生意助手2.0。這一創(chuàng)新產品的問世,標志著阿里巴巴助力中小企業(yè)外貿經營方面邁出了重要一步。
    的頭像 發(fā)表于 10-30 16:12 ?1049次閱讀