chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

通過稀疏性支持和變壓器優(yōu)化增強AI推理

星星科技指導員 ? 來源:嵌入式計算設(shè)計 ? 作者:Saumitra Jagdale ? 2022-10-18 09:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

英偉達張量RT 8 概述

NVIDIA 張量RT 是一個高性能推理平臺,對于利用 NVIDIA 張量核心 GPU 的強大功能至關(guān)重要。TensorRT 8 是一個具有增強功能的軟件開發(fā)工具包,旨在提高性能和準確性,以應對邊緣和嵌入式設(shè)備中發(fā)生的越來越多的 AI 推理。它允許對張量流和PyTorch神經(jīng)網(wǎng)絡(luò)進行廣泛的計算推斷。

與僅 CPU 平臺相比,TensorRT 可提供高達 40 倍的吞吐量,同時最大限度地減少延遲。它允許您從任何框架開始,并在生產(chǎn)中快速優(yōu)化、驗證和部署經(jīng)過訓練的神經(jīng)網(wǎng)絡(luò)。

新版本在 NVIDIA 安培 GPU 上集成了稀疏性,可修剪對網(wǎng)絡(luò)整體計算無貢獻的弱連接。此外,張量RT 8 支持變壓器優(yōu)化和 BERT 大。變壓器優(yōu)化可提高性能,而量化感知訓練可提高準確性。

英偉達的張量RT 8 有什么新功能?

推理的目的是在訓練階段盡可能多地保持準確性。訓練的模型可以在硬件設(shè)備上運行,以獲得客戶的最低響應時間和最大的吞吐量。但是,盡可能精確的必要性有時可能與邊緣可用的內(nèi)存量和吞吐量發(fā)生沖突。訓練有素、高度準確的模型可能運行速度太慢。

因此,TensorRT版本8結(jié)合了深度學習推理或訓練的神經(jīng)網(wǎng)絡(luò)模型應用的最新進展,以理解數(shù)據(jù)如何影響響應。它使用兩個主要功能將語言查詢推理時間減少一半:

英偉達安培架構(gòu)的稀疏性

深度神經(jīng)網(wǎng)絡(luò)擅長各種任務(wù),如計算機視覺、語音識別和自然語言處理。隨著處理這些神經(jīng)網(wǎng)絡(luò)所需的計算能力的增加,高效的建模和計算變得越來越重要。

稀疏是采用 NVIDIA 安培架構(gòu)的 GPU 的一種全新性能方法,通過減少計算流程來提高開發(fā)人員的效率。深度學習模型的其他方面不如其他方面重要,有些甚至可能為零。因此,神經(jīng)網(wǎng)絡(luò)不需要對特定權(quán)重或參數(shù)進行計算。因此,NVIDIA 可以通過使用稀疏性將模型的權(quán)重減少近一半來增強性能、吞吐量和延遲。

通過變壓器優(yōu)化減少推理計算

在張量RT 8中,性能增強是通過變壓器優(yōu)化實現(xiàn)的。量化開發(fā)人員可以利用訓練的模型通過 8 位計算 (INT8) 執(zhí)行推理。這大大減少了張量核心中的推理計算和存儲。INT8 越來越多地用于優(yōu)化機器學習框架,如張量流和 NVIDIA 的張量壓縮包,以減少內(nèi)存和計算需求。因此,NVIDIA可以在張量RT 8上提供非常高的性能,同時保持準確性。

例如,量化感知訓練 (QAT) 有可能將準確性提高一倍。因此,與舊版本張量RT 7相比,張量RT 8可以將許多模型的性能提高一倍。

張量RT部署在眾多行業(yè)中

TensorRT更好的性能和準確性使其成為醫(yī)療保健,汽車,互聯(lián)網(wǎng)/電信服務(wù),金融服務(wù)和零售等行業(yè)的熱門選擇。例如,張量RT用于為GE醫(yī)療保健的心血管超聲系統(tǒng)提供動力。數(shù)字診斷解決方案提供商使用該技術(shù)在其 Vivid E95 掃描器上加速了自動心臟視圖檢測。心臟病專家可以通過使用改進的視圖檢測算法,在早期階段做出更準確的診斷和檢測疾病。此外,TensorRT還被Verizon,福特,美國郵政服務(wù),美國運通和其他知名公司使用。

隨著張量RT 8的發(fā)布,NVIDIA還推出了使用張量RT的Google BERT大推理的突破,來自變形金剛的雙向編碼器表示(BERT)是一種基于變壓器的機器學習技術(shù),用于預訓練自然語言處理。BERT-Large 模型只需 1.2 毫秒進行分析,從而可以實時響應自然語言查詢。這意味著公司可以將其模型的尺寸增加一倍或三倍,以提高準確性。

像 BERT-Large 這樣的語言模型被許多推理服務(wù)在幕后使用。另一方面,基于語言的應用程序通常無法識別細微差別或情感,從而導致整體糟糕的體驗?,F(xiàn)在,公司可以使用張量RT 8在幾毫秒內(nèi)部署整個工作流程。這些突破可以為新一代對話式AI應用程序鋪平道路,為用戶提供更智能、更低的延遲體驗。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    37230

    瀏覽量

    292070
  • 變壓器
    +關(guān)注

    關(guān)注

    0

    文章

    1793

    瀏覽量

    4010
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    什么是UL變壓器

    與評估,并確認符合特定UL安全標準的變壓器。 簡單來說,它包含兩個關(guān)鍵點: ? ?它是一個變壓器? ?:完成電壓轉(zhuǎn)換(如480V轉(zhuǎn)380V)、電氣隔離等功能。 ? ?它擁有UL認證? ?:這個“認證”是一個標志,證明該變壓器的安
    的頭像 發(fā)表于 10-20 15:18 ?94次閱讀
    什么是UL<b class='flag-5'>變壓器</b>

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片

    和計算成本。 核心: MoE模型利用稀疏驅(qū)動結(jié)構(gòu),通過包含多個專家網(wǎng)絡(luò)的稀疏MoE層替換密集層,其中每個專家致力于特定的訓練數(shù)據(jù)或任務(wù)的子集,并且一個可訓練的門控機制動態(tài)地將輸入標記
    發(fā)表于 09-18 15:31

    信而泰×DeepSeek:AI推理引擎驅(qū)動網(wǎng)絡(luò)智能診斷邁向 “自愈”時代

    網(wǎng)絡(luò)智能診斷平臺。通過對私有化網(wǎng)絡(luò)數(shù)據(jù)的定向訓練,信而泰打造了高性能、高可靠的網(wǎng)絡(luò)診斷模型,顯著提升了AI輔助診斷的精準度與實用。該方案實現(xiàn)了網(wǎng)絡(luò)全流量深度解析能力與
    發(fā)表于 07-16 15:29

    華興變壓器:智能化監(jiān)測服務(wù),為BK機床控制變壓器保駕護航

    在自動化生產(chǎn)線中,BK機床控制變壓器的可靠是確保生產(chǎn)順利進行的關(guān)鍵。華興變壓器通過一系列創(chuàng)新舉措,成功提升了BK機床控制變壓器的可靠
    的頭像 發(fā)表于 07-08 14:55 ?255次閱讀
    華興<b class='flag-5'>變壓器</b>:智能化監(jiān)測服務(wù),為BK機床控制<b class='flag-5'>變壓器</b>保駕護航

    反激變換變壓器

    主要內(nèi)容 磁性元件對功率變換發(fā)展的重要 反激式變壓器的設(shè)計考慮 反激式變壓器雜散參數(shù)的效應 反激式變壓器的磁(場)特性-感性效應 反激
    發(fā)表于 07-01 15:32

    變壓器的設(shè)計實例(帶公式計算)

    部分,更加要求效率高、成本小、體積小、重量輕、具有可移動和能夠模塊化。變壓器作為開關(guān)電源必不可少磁性元件,對其進行合理優(yōu)化設(shè)計顯得非常重要。在高頻開關(guān)電源設(shè)計中,真止難以把握是磁路部分設(shè)計,開關(guān)電源
    發(fā)表于 05-23 17:45

    變壓器與電感設(shè)計手冊

    本書涉及了用于輕質(zhì)量、高頻率航空航天變壓器和低頻率、工業(yè)用變壓器設(shè)計的全部關(guān)鍵元器件。 修訂和擴展的目的在于展示磁器件設(shè)計領(lǐng)域當前的技術(shù)水平,此第三版給出了變壓器和電感設(shè)計的實際方法
    發(fā)表于 05-13 17:04

    一種分段氣隙的CLLC變換平面變壓器設(shè)計

    一種路徑,采用磁集成方法,對1MHz雙向CLLC變換變壓器進行研究、設(shè)計與測試,通過優(yōu)化PCB繞線方法、進行仿真優(yōu)化,提出了一種分段氣隙
    發(fā)表于 03-27 13:57

    OpenVINO? Toolkit中如何保持模型稀疏?

    OpenVINO? Toolkit 中支持優(yōu)化方法,保持模型稀疏。
    發(fā)表于 03-06 06:47

    如何解決強磁對高頻變壓器的影響

    降低磁場強度是減少強磁對高頻變壓器影響的一種直接方法。然而,需要注意的是,降低磁場強度可能會同時降低變壓器的效率。因此,在降低磁場強度的同時,需要綜合考慮其對變壓器性能的影響,確保在可接受的范圍內(nèi)。 二、
    的頭像 發(fā)表于 03-05 12:07 ?858次閱讀
    如何解決強磁對高頻<b class='flag-5'>變壓器</b>的影響

    開關(guān)變壓器與隔離變壓器比較

    為脈沖寬度調(diào)制(PWM)變壓器,是一種利用電子開關(guān)技術(shù)來控制變壓器輸入電壓的變壓器。它通過調(diào)節(jié)開關(guān)元件的導通時間來改變變壓器的輸入電壓,從而
    的頭像 發(fā)表于 02-06 15:22 ?1128次閱讀

    隔離變壓器與普通變壓器的區(qū)別在哪

    變壓器是電力系統(tǒng)中不可或缺的設(shè)備,它通過電磁感應原理實現(xiàn)電能的轉(zhuǎn)換和傳輸。在眾多變壓器中,隔離變壓器和普通變壓器是兩種常見的類型。它們在結(jié)構(gòu)
    的頭像 發(fā)表于 01-07 09:24 ?3242次閱讀

    變壓器專題三:變壓器被雷擊損壞原因?雷擊后變壓器能否繼續(xù)使用?

    1.直接雷擊:當雷電直接擊中變壓器或其附近的輸電線路時,會產(chǎn)生巨大的瞬態(tài)電流,瞬間通過變壓器的繞組和鐵芯,導致絕緣材料迅速發(fā)熱,甚至融化,造成繞組短路或燒毀。直接雷擊造成的損害往往是毀滅
    的頭像 發(fā)表于 12-12 14:49 ?2540次閱讀

    自耦變壓器的效率如何提高 自耦變壓器的負載特性

    自耦變壓器是一種特殊類型的變壓器,其中一個或多個繞組共享一個公共的磁芯。這種設(shè)計可以減少所需的繞組數(shù)量,從而減少材料成本和體積。然而,自耦變壓器的效率和負載特性受到多種因素的影響。 優(yōu)化
    的頭像 發(fā)表于 12-10 09:54 ?1217次閱讀

    自耦變壓器的工作原理 自耦變壓器與隔離變壓器的區(qū)別

    變壓器是電力系統(tǒng)中不可或缺的設(shè)備,它們用于改變電壓等級,以滿足不同用電設(shè)備的需求。在眾多變壓器類型中,自耦變壓器和隔離變壓器因其獨特的工作原理和應用場景而備受關(guān)注。 自耦
    的頭像 發(fā)表于 12-10 09:30 ?3490次閱讀