国产精品福利自产拍视频,午夜无码A级毛片免费视频,欧美3p精产视频在线观看

案例簡介

? 本案例中通過使用 NVIDIA GPU 加速平臺，騰訊平臺與內(nèi)容事業(yè)群（PCG）深度學習平臺實現(xiàn)了”無量推薦系統(tǒng)”模型訓練到在線推理的全流程GPU加速，整體效能性價比提升1~3倍。

? 本案例主要應用到 NVIDIA A100 Tensor Core GPU以及相關(guān)軟件的加速平臺。

客戶簡介及應用背景

無量推薦系統(tǒng)承載著騰訊平臺與內(nèi)容事業(yè)群的推薦場景，包括：騰訊看點（瀏覽器，QQ看點，商業(yè)化），騰訊新聞，騰訊視頻，騰訊音樂，閱文，應用寶，小鵝拼拼等。無量推薦系統(tǒng)支持日活躍用戶達數(shù)億級別，其中的模型數(shù)量達數(shù)千個，日均調(diào)用服務達到千億級別。

無量推薦系統(tǒng)在模型訓練和推理都能夠進行海量Embedding和DNN模型的GPU計算，是目前業(yè)界領(lǐng)先的體系結(jié)構(gòu)設計。

客戶挑戰(zhàn)

傳統(tǒng)推薦系統(tǒng)具有以下特點：訓練是基于參數(shù)服務器的框架，解決海量數(shù)據(jù)和稀疏特征的分布式訓練問題。推理通常分離大規(guī)模Embedding和DNN，只能進行DNN的GPU加速。

所以，傳統(tǒng)的推薦系統(tǒng)架構(gòu)也具有局限性：

大規(guī)模分布式架構(gòu)有大量的額外開銷，比如參數(shù)和梯度的網(wǎng)絡收發(fā)。

隨著DNN模型復雜性的的進一步提升，CPU的計算速度開始捉襟見肘。

隨著業(yè)務的快速增長，日活用戶增多，對其調(diào)用數(shù)量快速增加，給推薦系統(tǒng)后臺帶來了新的挑戰(zhàn)：

1，模型更加復雜，計算量更大，但是參數(shù)服務器的分布式架構(gòu)有效計算比很低。

2，海量Embedding因為規(guī)模龐大，查詢和聚合計算難以有效利用GPU高性能顯存和算力的優(yōu)勢。

應用方案

基于以上的挑戰(zhàn)，騰訊選擇使用基于NVIDIA A100 Tensor Core GPU的分布式系統(tǒng)架構(gòu)來創(chuàng)建無量推薦系統(tǒng)。

1，通過多級存儲和Pipeline優(yōu)化，在HPC上完成大規(guī)模推薦模型的GPU的高性能訓練。

2，基于特征訪問Power-law分布的特性，GPU緩存高頻特征參數(shù)，同時從CPU中動態(tài)獲取低頻特征參數(shù)，實現(xiàn)了大規(guī)模推薦模型完整的GPU端到端模型推理。

使用效果及影響

騰訊平臺與內(nèi)容事業(yè)群有多種類型的推薦業(yè)務場景。比如信息流推薦的QQ瀏覽器、QQ看點，新聞推薦的騰訊新聞，視頻推薦的騰訊視頻、微視，App推薦的應用寶，以及騰訊音樂的音樂推薦和閱文集團的文學推薦。

無量推薦系統(tǒng)承載了這些推薦業(yè)務場景的模型訓練和推理服務?；趥鹘y(tǒng)的推薦系統(tǒng)架構(gòu)，無量使用大量CPU資源，通過分布式架構(gòu)可以擴展到TB級模型的訓練和部署，取得了巨大的成功。

隨著業(yè)務的快速增長，日活用戶增多，對其調(diào)用數(shù)量快速增加，傳統(tǒng)架構(gòu)局限性限制了推薦系統(tǒng)的架構(gòu)擴展和性能提升。

通過使用GPU訓練和推理，單機多卡的GPU算力可以達到數(shù)十臺CPU機器的算力，節(jié)省了大量的額外分布式開銷。通過充分利用A100 GPU高性能顯存快速訪問Embedding，以及并行算力處理DNN推理，單張A100 GPU可以在相同的延遲下推理10倍于CPU的打分樣本。

目前基于GPU的推薦架構(gòu)可以提升模型訓練和推理性價比1~3倍。

展望未來，無量推薦系統(tǒng)將不斷優(yōu)化推薦模型在GPU上的應用，利用HPC多機多卡，混合精度等能力，進一步提高推薦場景使用GPU的性價比。

審核編輯：郭婷

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
5444

瀏覽量
108598
gpu

gpu

+關(guān)注

關(guān)注
28

文章
5050

瀏覽量
134028

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

搜索歷史

NVIDIA GPU助力騰訊PCG加速無量推薦系統(tǒng)

評論