chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用NVIDIA GPU助力美團(tuán)CTR預(yù)測服務(wù)升級

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-13 15:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

案例簡介

本案例中美團(tuán)機(jī)器學(xué)習(xí)平臺使用 NVIDIA GPU 支持其多方面優(yōu)化策略,從而提高吞吐能力及降低響應(yīng)延遲。通過算子融合、計算圖等價替換等一系列優(yōu)化 ,相較于 CPU 在相同成本約束下,NVIDIA T4 GPU 大幅加速美團(tuán) CTR(Click-Through-Rate)模型預(yù)測性能,神經(jīng)網(wǎng)絡(luò)模型吞吐能力提升了 10 倍;同時在搜索精排場景中,端到端整體吞吐能力提升了一倍以上,助力美團(tuán) CTR 向新一代服務(wù)升級。

? 本案例為 NVIDIA GPU 推理加速互聯(lián)網(wǎng)行業(yè) CTR 模型的典型應(yīng)用

? 本案例主要應(yīng)用到 T4 GPU 和 NVIDIA 各 SDK 以及 CUDA 加速手段

客戶簡介及應(yīng)用背景

美團(tuán)是一家集生活服務(wù)及商品零售的電商平臺,公司聚焦“零售+科技”戰(zhàn)略,以“吃”為核心,通過科技創(chuàng)新,服務(wù)于生活服務(wù)業(yè)需求側(cè)和供給側(cè)數(shù)字化升級。美團(tuán)在中國業(yè)務(wù)涵蓋餐飲、配送、網(wǎng)約車、共享單車、酒店及旅游預(yù)訂、電影票務(wù)等 200 多個服務(wù)品類,覆蓋全國 2800 個市區(qū)縣,服務(wù) 6.7 億活躍用戶和 830 萬活躍商家。

伴隨著用戶規(guī)模的提升和業(yè)務(wù)的精細(xì)化運(yùn)營,業(yè)務(wù)側(cè)對推薦系統(tǒng)的準(zhǔn)確度、吞吐能力和時延都提出了新的挑戰(zhàn),而 CTR 模型作為推薦系統(tǒng)的核心模型,其效果直接影響業(yè)務(wù)的收入。

客戶挑戰(zhàn)

美團(tuán)的 CTR 模型過去一直在使用 CPU 推理的方式,但隨著用戶訪問量的提升和深度神經(jīng)網(wǎng)絡(luò)的引入,CTR 模型結(jié)構(gòu)趨于復(fù)雜,吞吐和計算量也越來越大,CPU 開始不能滿足模型對于算力的需求,而僅僅通過 CPU 服務(wù)器的堆疊帶來的性能提升性價比相較偏低。

而 GPU 擁有數(shù)以千計的計算核心,可以在單機(jī)內(nèi)提供密集的并行計算能力,特別適合深度學(xué)習(xí)場景,在行業(yè)內(nèi)已經(jīng)在 CV、NLP 等領(lǐng)域展示了強(qiáng)大的能力。通過 CUDA 及相關(guān) API,NVIDIA建立了完整的 GPU 生態(tài)系統(tǒng)?;诖?,美團(tuán)基礎(chǔ)研發(fā)平臺將 CTR 模型部署到 GPU 上,并通過一系列針對 CPU 與 GPU 的異構(gòu)系統(tǒng)并行計算設(shè)計、數(shù)據(jù)存儲方式和傳輸方式上的特定優(yōu)化,希望能通過 GPU 強(qiáng)大的計算力,協(xié)助美團(tuán)在 CTR 預(yù)測的各業(yè)務(wù)場景中發(fā)揮出最大優(yōu)勢。

應(yīng)用方案

為了解決算力瓶頸及上述各種挑戰(zhàn),美團(tuán)機(jī)器學(xué)習(xí)平臺采用 NVIDIA AI 計算平臺,在繼 CV、NLP 及 CTR 訓(xùn)練后,也使用了 NVIDIA T4來提供 CTR 預(yù)測支持,大幅提升用戶體驗與服務(wù)穩(wěn)定性。除此之外,時延也是業(yè)務(wù)側(cè)非常重視的性能指標(biāo),許多復(fù)雜模型縱有更好的準(zhǔn)確度,但卻因響應(yīng)時間不達(dá)標(biāo)而無法落地應(yīng)用,例如,在某搜索框自動補(bǔ)全的場景,由于天然的交互屬性,時延要求非常苛刻,一般來說無法使用復(fù)雜的模型。而在 GPU 能力的加持下,其復(fù)雜模型的平均響應(yīng)時間從 15 毫秒降低至 6~7 毫秒,足足縮短了一倍多,達(dá)到了上線要求。

使用效果及影響

通過 NVIDIA T4 深度優(yōu)化方案,成功為美團(tuán) CTR 模型創(chuàng)造更多應(yīng)用機(jī)會,不僅極大地提升了系統(tǒng)吞吐量,更進(jìn)一步地提升了整個模型訓(xùn)練的速度與降低訓(xùn)練成本,落實 AI 框架在 GPU上性能推理的優(yōu)化實踐。

“在美團(tuán)和英偉達(dá)的共同努力下,我們將 CTR 預(yù)測服務(wù)成功的遷移到 GPU 平臺上,在為業(yè)務(wù)提供更好的支撐的同時也獲得了更好的性價比;下一步,機(jī)器學(xué)習(xí)平臺計劃采用 NVIDIA Triton 推理服務(wù)框架和 NVIDIA Ampere A30,進(jìn)一步提升美團(tuán)推理服務(wù)的效率?!?/p>

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5442

    瀏覽量

    108531
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5050

    瀏覽量

    133982
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    37165

    瀏覽量

    291481
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA RTX PRO 4500 Blackwell GPU測試分析

    今天我們帶來全新 NVIDIA Blackwell 架構(gòu) GPU —— NVIDIA RTX PRO 4500 Blackwell 的測試,對比上一代產(chǎn)品 NVIDIA RTX 450
    的頭像 發(fā)表于 08-28 11:02 ?2225次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 4500 Blackwell <b class='flag-5'>GPU</b>測試分析

    NVIDIA桌面GPU系列擴(kuò)展新產(chǎn)品

    NVIDIA 桌面 GPU 系列擴(kuò)展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell
    的頭像 發(fā)表于 08-18 11:50 ?777次閱讀

    睿海光電以高效交付與廣泛兼容助力AI數(shù)據(jù)中心800G光模塊升級

    器件敏捷調(diào)配。 定制化服務(wù):支持OEM/ODM/JDM模式,滿足客戶從標(biāo)準(zhǔn)品到液冷模塊的多元化需求。 這一優(yōu)勢已助力多家頭部云服務(wù)商在AI云平臺部署中搶占市場窗口期。 三、廣泛兼容性:平滑升級
    發(fā)表于 08-13 19:01

    光耦的CTR是什么?

    晶體管輸出型光耦的性能,取決于其輸入?yún)?shù)、輸出參數(shù)和傳輸特性,傳輸特性決定著其電性能傳送能力和特點(diǎn)。其中最重要的參數(shù)為電流傳輸比(Currenttransferratio)CTR,設(shè)計電路時,除了
    的頭像 發(fā)表于 06-13 14:32 ?667次閱讀
    光耦的<b class='flag-5'>CTR</b>是什么?

    Altair One? 云端門戶與 NVIDIA Omniverse 實時數(shù)字孿生藍(lán)圖完成全面整合

    正式宣布其?Altair One?云端門戶與?NVIDIA Omniverse 實時數(shù)字孿生藍(lán)圖實現(xiàn)技術(shù)融合。通過整合?GPU 加速、NVIDIA NIM 微服務(wù)與?Omniverse
    的頭像 發(fā)表于 04-02 14:01 ?426次閱讀

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發(fā)

    NVIDIA GTC 推出新一代專業(yè)級 GPU 和 AI 賦能的開發(fā)者工具—同時,ChatRTX 更新現(xiàn)已支持 NVIDIA NIM,RTX Remix 正式結(jié)束測試階段,本月的 NVIDIA
    的頭像 發(fā)表于 03-28 09:59 ?903次閱讀

    NVIDIA助力解決量子計算領(lǐng)域重大挑戰(zhàn)

    NVIDIA 加速量子研究中心提供了強(qiáng)大的工具,助力解決量子計算領(lǐng)域的重大挑戰(zhàn)。
    的頭像 發(fā)表于 03-27 09:17 ?865次閱讀

    NVIDIA GPU助力科研人員探索外星世界

    NVIDIA GPU 驅(qū)動的深度學(xué)習(xí)在短短幾秒內(nèi)解讀出了卡西尼號土星探測器多年來收集的海量數(shù)據(jù),為科研人員探索外星世界提供了更加智能的方式。
    的頭像 發(fā)表于 02-27 10:37 ?744次閱讀

    上汽乘用車與團(tuán)達(dá)成戰(zhàn)略合作

    的達(dá)成,無疑將為雙方的用戶、商家、經(jīng)銷商及員工帶來更加全面和優(yōu)質(zhì)的服務(wù)體驗。上汽乘用車作為國內(nèi)領(lǐng)先的汽車制造商,擁有強(qiáng)大的產(chǎn)品研發(fā)和生產(chǎn)能力,而團(tuán)則以其廣泛的用戶基礎(chǔ)和強(qiáng)大的互聯(lián)網(wǎng)服務(wù)
    的頭像 發(fā)表于 01-21 15:22 ?1122次閱讀

    豐田、Aurora和大陸集團(tuán)加入NVIDIA合作伙伴行列

    NVIDIA 宣布,豐田、Aurora 和大陸集團(tuán)已加入全球移動出行領(lǐng)導(dǎo)者行列,利用 NVIDIA 加速計算和 AI 開發(fā)構(gòu)建乘用與商用車型。
    的頭像 發(fā)表于 01-08 10:50 ?759次閱讀

    NVIDIA和GeForce RTX GPU專為AI時代打造

    NVIDIA 和 GeForce RTX GPU 專為 AI 時代打造。
    的頭像 發(fā)表于 01-06 10:45 ?1098次閱讀

    NVIDIA預(yù)測2025年AI行業(yè)發(fā)展

    NVIDIA 加速計算、數(shù)據(jù)科學(xué)和研究領(lǐng)域?qū)<?b class='flag-5'>預(yù)測,多模態(tài)模型將推動行業(yè)創(chuàng)新和效率提升。
    的頭像 發(fā)表于 12-18 13:49 ?1521次閱讀

    《CST Studio Suite 2024 GPU加速計算指南》

    的各個方面,包括硬件支持、操作系統(tǒng)支持、許可證、GPU計算的啟用、NVIDIA和AMD GPU的詳細(xì)信息以及相關(guān)的使用指南和故障排除等內(nèi)容。 1. 硬件支持 - NVIDIA
    發(fā)表于 12-16 14:25

    全新NVIDIA NIM微服務(wù)實現(xiàn)突破性進(jìn)展

    全新 NVIDIA NIM 微服務(wù)實現(xiàn)突破性進(jìn)展,可助力氣象技術(shù)公司開發(fā)和部署 AI 模型,實現(xiàn)對降雪、結(jié)冰和冰雹的預(yù)測
    的頭像 發(fā)表于 11-21 10:07 ?904次閱讀

    AMD與NVIDIA GPU優(yōu)缺點(diǎn)

    在圖形處理單元(GPU)市場,AMD和NVIDIA是兩大主要的競爭者,它們各自推出的產(chǎn)品在性能、功耗、價格等方面都有著不同的特點(diǎn)和優(yōu)勢。 一、性能 GPU的性能是用戶最關(guān)心的指標(biāo)之一。在高端市場
    的頭像 發(fā)表于 10-27 11:15 ?4762次閱讀