chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

通過NVIDIA TensorRT加速夸克瀏覽器AI應(yīng)用

星星科技指導(dǎo)員 ? 來源:NVIDIA ? 作者:NVIDIA ? 2022-04-21 14:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

客戶簡介

? 本案例中通過TensorRT加速夸克瀏覽器視頻圖像相關(guān)模型的預(yù)測性能,比如待上線業(yè)務(wù)的相關(guān)流程整體性能達(dá)不到線上要求,通過對(duì)全流程的優(yōu)化以及使用NVIDIA TensorRT加速模型后,最終整體性能由10s級(jí)別降到400ms內(nèi),其中模型性能加速1~3倍,顯存占用下降50%。

? 本案例主要應(yīng)用到NVIDIA TensorRT、NVIDIA Nsight Systems

客戶簡介及應(yīng)用背景

夸克瀏覽器是阿里旗下的一個(gè)搭載極速AI引擎的高速智能瀏覽器。夸客以極速智能搜索為定位,致力于為用戶提供交互更智能高效、內(nèi)容更專業(yè)權(quán)威的新一代搜索引擎,同時(shí)也在產(chǎn)品極致體驗(yàn)上不斷實(shí)現(xiàn)突破。

夸克目前不僅提供極致的搜索體驗(yàn),也在探索以深度學(xué)習(xí)為基礎(chǔ)的AI工具,通過高效的算法效果和全流程的性能優(yōu)化,提供更好的用戶體驗(yàn)。深度學(xué)習(xí)模型在實(shí)際應(yīng)用的過程中,效果遠(yuǎn)好于傳統(tǒng)模型,但由于算法復(fù)雜度過高,預(yù)測性能成為制約模型最終能否上線的核心問題。NVIDIA TensorRT通過計(jì)算圖的優(yōu)化、高效Kernel的實(shí)現(xiàn)及更高效硬件的利用加速模型預(yù)測耗時(shí),使預(yù)測速度提升了1~3倍。

客戶挑戰(zhàn)

夸克瀏覽器為用戶提供智能相機(jī)功能,打開夸克APP后,通過相機(jī)入口(如下左圖紅框所示)進(jìn)入智能相機(jī)功能,可以看到智能相機(jī)提供的具體功能(如下右圖所示),包括萬能掃描、學(xué)習(xí)輔導(dǎo)、萬物識(shí)別等功能,這些功能對(duì)實(shí)時(shí)性要求極高,不少功能的底層核心技術(shù)依賴OCR。作為核心一環(huán),OCR需要承接巨大流量,其效果及性能影響整個(gè)上層業(yè)務(wù)的用戶體驗(yàn)。

OCR全流程包含檢測、識(shí)別等多個(gè)模型以及復(fù)雜的前后處理,整體耗時(shí)10s級(jí)別,耗時(shí)過長嚴(yán)重影響用戶體驗(yàn),無法達(dá)到上線要求。主要影響性能的因素有以下三點(diǎn):單個(gè)模型占用顯存過大導(dǎo)致全流程無法部署在同一個(gè)GPU上,需要在多個(gè)GPU上進(jìn)行數(shù)據(jù)傳輸,多GPU部署導(dǎo)致GPU利用率不高;模型本身性能慢,涉及復(fù)雜的檢測和識(shí)別模型;全流程中模型前后處理復(fù)雜。

應(yīng)用方案

對(duì)比目前性能優(yōu)化方案,夸克選擇了采用NVIDIA TensorRT作為模型優(yōu)化的底層框架對(duì)模型進(jìn)行優(yōu)化。TensorRT提供完整端到端模型性能優(yōu)化工具,支持TF和ONNX等相關(guān)框架模型,使用后對(duì)模型性能帶來巨大提升。

TensorRT對(duì)模型結(jié)構(gòu)進(jìn)行優(yōu)化,使用高效KERNEL實(shí)現(xiàn),并且支持FP16和INT8量化。部分模型通過使用TensorRt后,模型性能有2到3倍的提升,并且顯存降到原來的30%~50%。

有模型在使用FP16精度后,模型效果下降,夸克團(tuán)隊(duì)在NVIDIA的工作人員的指導(dǎo)下,通過對(duì)模型設(shè)置混合精度后,模型的性能較FP16稍微下降,但是整體效果也達(dá)到要求。

對(duì)于部分轉(zhuǎn)TensorRT失敗的模型,我們對(duì)模型進(jìn)行分析,把模型耗時(shí)的部分單獨(dú)抽取出來,單獨(dú)做模型優(yōu)化。

在使用TensorRT的過程中,通過Nsight Systems發(fā)現(xiàn)TensorRT OP在某些場景性能表現(xiàn)不盡人意,最后在NVIDIA工作人員指導(dǎo)下,通過調(diào)整OP的使用方式解決該問題。

使用效果及影響

通過使用NVIDIA TensorRT,夸克瀏覽器極大地提升了模型性能和降低模型本身顯存占用,提高了GPU的使用率。在對(duì)整體流程和模型進(jìn)行優(yōu)化后,全部模型能夠部署在單個(gè)GPU上,并且整體耗時(shí)在400ms內(nèi)。

夸克技術(shù)人員表示:TensorRT文檔齊全,功能使用方便,用戶能夠以低門檻使用其帶來的優(yōu)化,無需手動(dòng)編寫復(fù)雜模型轉(zhuǎn)換工具,大大地減少了用戶投入成本。對(duì)比其他模型優(yōu)化框架,TensorRT具有更好的通用性、易用性和性能。

通過這次對(duì)OCR全流程的性能優(yōu)化,夸克瀏覽器也積累了一套適合內(nèi)部使用的模型性能優(yōu)化方案,在遇到其他模型性能問題時(shí)也有的放矢。目前夸克已經(jīng)把TensorRT相關(guān)優(yōu)化工具集成到其瀏覽器的內(nèi)部平臺(tái)上,同時(shí)應(yīng)用到其他業(yè)務(wù)的模型中,并取得良好的效果。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5570

    瀏覽量

    109384
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5152

    瀏覽量

    134750
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    夸克AI眼鏡“一機(jī)難求”,核心供應(yīng)商曝已新增產(chǎn)線

    夸克AI眼鏡“爆單”后,市場需求遠(yuǎn)超預(yù)期,線上線下“一機(jī)難求”。夸克AI眼鏡的一些核心供應(yīng)商披露,目前夸克
    發(fā)表于 12-11 17:39 ?1418次閱讀
    <b class='flag-5'>夸克</b><b class='flag-5'>AI</b>眼鏡“一機(jī)難求”,核心供應(yīng)商曝已新增產(chǎn)線

    利用NVIDIA Cosmos開放世界基礎(chǔ)模型加速物理AI開發(fā)

    NVIDIA 最近發(fā)布了 NVIDIA Cosmos 開放世界基礎(chǔ)模型(WFM)的更新,旨在加速物理 AI 模型的測試與驗(yàn)證數(shù)據(jù)生成。借助 NVID
    的頭像 發(fā)表于 12-01 09:25 ?884次閱讀

    NVIDIA TensorRT LLM 1.0推理框架正式上線

    TensorRT LLM 作為 NVIDIA 為大規(guī)模 LLM 推理打造的推理框架,核心目標(biāo)是突破 NVIDIA 平臺(tái)上的推理性能瓶頸。為實(shí)現(xiàn)這一目標(biāo),其構(gòu)建了多維度的核心實(shí)現(xiàn)路徑:一方面,針對(duì)需
    的頭像 發(fā)表于 10-21 11:04 ?1017次閱讀

    Microsoft Edge瀏覽器iOS端插件功能上線

    在最新發(fā)布的 139 版本中,Microsoft Edge 瀏覽器 iOS 端正式支持插件功能!與此同時(shí),Microsoft Edge 安卓端的插件數(shù)量已躍升至近 30 款。廣告攔截、雙語翻譯、資源下載……你的手機(jī)瀏覽器,也能擁有自定義的「超能力」。
    的頭像 發(fā)表于 08-19 14:29 ?1594次閱讀

    NVIDIA RTX AI加速FLUX.1 Kontext現(xiàn)已開放下載

    NVIDIA RTX 與 NVIDIA TensorRT 現(xiàn)已加速 Black Forest Labs 的最新圖像生成和編輯模型;此外,Gemma 3n 現(xiàn)可借助 RTX 和
    的頭像 發(fā)表于 07-16 09:16 ?1992次閱讀

    NVIDIA全棧加速代理式AI應(yīng)用落地

    在近期舉辦的 AWS 中國峰會(huì)上,NVIDIA 聚焦于“NVIDIA 全棧加速代理式 AI 應(yīng)用落地”,深入探討了代理式 AI (Agent
    的頭像 發(fā)表于 07-14 11:41 ?1206次閱讀

    如何在魔搭社區(qū)使用TensorRT-LLM加速優(yōu)化Qwen3系列模型推理部署

    TensorRT-LLM 作為 NVIDIA 專為 LLM 推理部署加速優(yōu)化的開源庫,可幫助開發(fā)者快速利用最新 LLM 完成應(yīng)用原型驗(yàn)證與產(chǎn)品部署。
    的頭像 發(fā)表于 07-04 14:38 ?1988次閱讀

    使用NVIDIA Triton和TensorRT-LLM部署TTS應(yīng)用的最佳實(shí)踐

    針對(duì)基于 Diffusion 和 LLM 類別的 TTS 模型,NVIDIA Triton 和 TensorRT-LLM 方案能顯著提升推理速度。在單張 NVIDIA Ada Lovelace
    的頭像 發(fā)表于 06-12 15:37 ?1558次閱讀
    使用<b class='flag-5'>NVIDIA</b> Triton和<b class='flag-5'>TensorRT</b>-LLM部署TTS應(yīng)用的最佳實(shí)踐

    老電視如何安裝瀏覽器?

    2017年購買的夏普老電視,1.5G+8G存儲(chǔ),網(wǎng)上下的瀏覽器APK文件在電視內(nèi)打開就彈出“解析程序包出現(xiàn)問題”。 未知來源選項(xiàng)已打開,存儲(chǔ)空間清空到只剩下三個(gè)應(yīng)用(只占用300M左右),基本可
    發(fā)表于 06-01 18:57

    NVIDIA攜手微軟加速代理式AI發(fā)展

    代理式 AI 正在重新定義科學(xué)探索,推動(dòng)各行各業(yè)的研究突破和創(chuàng)新發(fā)展。NVIDIA 和微軟正通過深化合作提供先進(jìn)的技術(shù),從云到 PC 加速代理式 A
    的頭像 發(fā)表于 05-27 14:03 ?901次閱讀

    NVIDIA Cosmos加速機(jī)器人和自動(dòng)駕駛汽車物理AI發(fā)展

    NVIDIA Cosmos 通過可預(yù)測未來世界狀態(tài)的世界基礎(chǔ)模型加速物理 AI 的發(fā)展。
    的頭像 發(fā)表于 04-24 11:01 ?1116次閱讀
    <b class='flag-5'>NVIDIA</b> Cosmos<b class='flag-5'>加速</b>機(jī)器人和自動(dòng)駕駛汽車物理<b class='flag-5'>AI</b>發(fā)展

    英偉達(dá)GTC2025亮點(diǎn):Oracle與NVIDIA合作助力企業(yè)加速代理式AI推理

    Oracle 數(shù)據(jù)庫與 NVIDIA AI 相集成,使企業(yè)能夠更輕松、快捷地采用代理式 AI Oracle 和 NVIDIA 宣布,NVIDIA
    的頭像 發(fā)表于 03-21 12:01 ?1315次閱讀
    英偉達(dá)GTC2025亮點(diǎn):Oracle與<b class='flag-5'>NVIDIA</b>合作助力企業(yè)<b class='flag-5'>加速</b>代理式<b class='flag-5'>AI</b>推理

    Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理

    ——Oracle 和 NVIDIA 今日宣布,NVIDIA 加速計(jì)算和推理軟件與 Oracle 的 AI 基礎(chǔ)設(shè)施以及生成式 AI 服務(wù)首
    發(fā)表于 03-19 15:24 ?517次閱讀
    Oracle 與 <b class='flag-5'>NVIDIA</b> 合作助力企業(yè)<b class='flag-5'>加速</b>代理式 <b class='flag-5'>AI</b> 推理

    edge瀏覽器識(shí)別 latex語法插件

    默認(rèn)的瀏覽器是沒有l(wèi)atex識(shí)別功能的,容易顯示為亂碼或者源碼,無法正常識(shí)別。本插件需要在瀏覽器的擴(kuò)展程序菜單下安裝,能在edge下完美運(yùn)行。本插件是免費(fèi)插件。
    發(fā)表于 03-17 18:03 ?1次下載

    騰訊AI To C業(yè)務(wù)大調(diào)整:QQ瀏覽器、搜狗等轉(zhuǎn)入CSIG

    騰訊內(nèi)部近期完成了一次重要的產(chǎn)品及團(tuán)隊(duì)調(diào)整,標(biāo)志著其AI To C業(yè)務(wù)戰(zhàn)略的新一輪變革。據(jù)悉,QQ瀏覽器、搜狗輸入法以及ima等多款產(chǎn)品和應(yīng)用,將正式并入CSIG(云與智慧產(chǎn)業(yè)事業(yè)群)。 此次調(diào)整
    的頭像 發(fā)表于 02-20 09:22 ?1475次閱讀