chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

MLPerf V2.0推理結果放榜,NVIDIA表現(xiàn)搶眼

荷葉塘 ? 來源:電子發(fā)燒友 ? 作者:程文智 ? 2022-04-15 22:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

(文/程文智)不久前,AI性能基準評測平臺MLPerf公布了2022年首次推理(Inference v2.0)測試成績,NVIDIA的AI平臺表現(xiàn)依然搶眼。

據(jù)MLPerf官方介紹,它是由來自學術界、研究實驗室和相關行業(yè)的 AI 領導者組成的聯(lián)盟,旨在“構建公平和有用的基準測試”,在規(guī)定的條件下,針對硬件、軟件和服務的訓練和推理性能提供公平的評估。每年組織AI推理和AI訓練測試各兩次,以對迅速增長的AI計算需求與性能進行及時的跟蹤測評。MLPerf比賽通常分為固定任務(Closed)和開放優(yōu)化(Open)兩類任務,開放優(yōu)化能力著重考察參測廠商的AI技術創(chuàng)新力,固定任務則因更公平地考察參測廠商的硬件系統(tǒng)和軟件優(yōu)化的能力,成為更具參考價值的AI性能基準測試。因此,目前MLPerf被看作是AI領域的風向標,誰能夠在這個測試中取得更多的領先,誰的AI能力就越突出。


在最新一期的榜單中,浪潮、NVIDIA、英特爾、高通、阿里巴巴、戴爾、Deci.ai、Azure、富士通、技嘉、聯(lián)想、寧暢、美超微、華碩、浙江實驗室、及新華三等廠商參與了競賽。評測以最新MLPerf Inference V2.0為基準,涵蓋了圖像分類、目標檢測、醫(yī)療圖像分割、自然語言處理、語音轉文字和推薦系統(tǒng)6類AI應用場景,分為數(shù)據(jù)中心和邊緣兩類處理場景,每類場景都包含固定任務(Closed)和開放優(yōu)化(Open)兩類性能競賽。其中,在最新的V2.0規(guī)范中,在邊緣運算環(huán)境導入多資料流(Multi Stream)測試項目,測量邊緣運算設備在多攝影機、多傳感器場景的性能表現(xiàn),以得到更貼近真實使用情況的數(shù)據(jù)。


據(jù)統(tǒng)計,本輪測試一共展示了超過3900 次性能測試和 2200 次功耗測試,分別是上一輪的2倍和6倍。根據(jù)公開的數(shù)據(jù)顯示,本次測試中除了戴爾科技、富士通、技嘉、浪潮、聯(lián)想、寧暢和美超微等外,華碩和新華三本次測試中首次使用了NVIDIA AI平臺提交MLPerf結果。

Jetson AGX Orin提升邊緣AI性能,取得不俗成績

值得一提的是基于NVIDIA Ampere架構的低功耗系統(tǒng)級芯片NVIDIA Orin首次參加MLPerf基準測試,就取得了不俗的成績。在邊緣AI領域,NVIDIA Orin預生產版本在六項性能測試中的五項處于領先地位,其運行速度比上一代Jetson AGX Xavier快了5倍,能效平均提高了2倍。


根據(jù)NVIDIA官網(wǎng)的介紹,Jetson AGX Orin 系列有32GB和64GB兩個版本,該系列具有高達275TOPS的AI性能,由 Ampere GPU深度學習加速器 (DLA) 提供支持。CPU配備了多達12個Arm Cortex A78AE內核。

Orin配備了其第三代Tensor Cores,可提高性能并支持稀疏矩陣。基于NVIDIA為 Xavier 所做的多處理器構建,它不僅具有 GPU 和CPU,還具有其他處理器,可以幫助從GPU和CPU卸載應用程序的某些部分。它包括一個專用于 AI 應用的深度學習加速器、一個用于計算機視覺應用和ISP的視覺加速器,以及一個視頻解碼和視頻編碼引擎。與 Xavier 相比,NVIDIA還為 Orin 帶來了 LPDDR5 以提高帶寬,傳輸速度可達204.8GB/s。 Orin 還具備豐富的IO連接,比如其具有多達22個PCIe4.0通道、4個千兆以太網(wǎng)、16個MIPI CSI通道,以及各種其他傳感器接口等。


根據(jù)測試,Jetson AGX Orin提供了8倍于Jetson AGX Xavier的性能,Jetson AGX Orin是能夠運行所有六項MLPerf基準測試的邊緣加速器。憑借JetPack SDK,Orin可以運行整個NVIDIA AI平臺,這個軟件堆棧已經在數(shù)據(jù)中心和云端得到了驗證,并且獲得了NVIDIA Jetson平臺100萬名開發(fā)者的支持。


在應用方面,目前,Orin主要關注三大領域,分別為:工業(yè)、自動駕駛和醫(yī)療。Orin現(xiàn)已加入到用于機器人和自動化系統(tǒng)的NVIDIA Jetson AGX Orin開發(fā)者套件。包括亞馬遜網(wǎng)絡服務、約翰迪爾、小松、美敦力和微軟Azure在內的6000多家客戶使用NVIDIA Jetson平臺進行AI推理或其他任務。

Orin也是NVIDIA Hyperion自動駕駛汽車平臺的關鍵組成部分。據(jù)NVIDIA介紹,Orin可處理在自動駕駛汽車和機器人中同時運行的大量應用和深度神經網(wǎng)絡,并且達到了ISO 26262 ASIL-D 等系統(tǒng)安全標準。而且,比亞迪近期已經宣布,他們將在其新一代自動駕駛電動汽車中使用內置Orin的DRIVE Hyperion架構。

Orin同樣也是NVIDIA Clara Holoscan醫(yī)療設備平臺的關鍵組成部分,且該平臺可供系統(tǒng)制造商和研究人員用來開發(fā)新一代AI儀器。

NVIDIA其他AI成果

除了Orin之外,本輪MLPerf,驗證了NVIDIA的多項成果,包括多實例GPU(MIG)、TensorRT等。比如MIG可提升每個 NVIDIA A100 Tensor 核心 GPU 的性能和價值。MIG可將 A100 GPU 劃分為多達七個實例,每個實例均與各自的高帶寬顯存、緩存和計算核心完全隔離。管理員可以支持從大到小的各項工作負載,為每項工作提供規(guī)模適當?shù)?GPU,而且服務質量 (QoS) 穩(wěn)定可靠,從而優(yōu)化利用率,讓每位用戶都能享用加速計算資源。


而根據(jù)實際測試結果,在使用7個實例時的性能為僅用一個實例的98%,這也意味著MIG可以充分利用GPU,避免了算力的浪費。


軟件是性能提升的關鍵驅動因素,NVIDIA在AI推理方面的軟件包括了用于優(yōu)化 AI 模型的 NVIDIA TensorRT 和用于有效部署它們的 NVIDIA Triton開源推理服務軟件。NVIDIA AI 推理和云高級產品經理David Salvator在媒體發(fā)布會上介紹了NVIDIA的Triton開源推理服務軟件。


目前TensorRT廣泛的優(yōu)化GPU內核庫已支持Jetson Orin,MLPerf中使用的插件已全部移植到Orin并添加到 TensorRT 8.4。Triton則Kubernetes緊密集成,可以管理GPU以及x86和Arm CPU上的AI推理工作,NVIDIA宣布,Triton現(xiàn)在可以只在CPU上運行,而無需GPU。

而也正是因為NVIDIA的跨平臺管理能力,使A100在Arm和x86-64平臺上的性能幾乎相同。并且,通過NVIDIA的軟件優(yōu)化,AI性能在過去一年中就增長了高達50%。

結語

這幾年,NVIDIA在AI領域一路狂奔,不僅僅在數(shù)據(jù)中心方面優(yōu)勢明顯,在汽車、邊緣計算方面也正推出優(yōu)勢產品,另外在他們還在準備推出工業(yè)級的AI產品,進入傳統(tǒng)工業(yè)領域。AI正在不斷滲透到人們生活的各個方面。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5309

    瀏覽量

    106419
  • AI
    AI
    +關注

    關注

    88

    文章

    35164

    瀏覽量

    280002
  • 人工智能
    +關注

    關注

    1807

    文章

    49029

    瀏覽量

    249562
  • 推理
    +關注

    關注

    0

    文章

    8

    瀏覽量

    7349
  • MLPerf
    +關注

    關注

    0

    文章

    36

    瀏覽量

    824
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    智嵌云V2.0獲軟件著作權登記,賦能行業(yè)數(shù)字化升級

    深圳智嵌物聯(lián)網(wǎng)電子技術有限公司,自主研發(fā)的智嵌云V2.0,成功斬獲國家版權局頒發(fā)的軟件著作權登記證書。這一成果不僅是該公司在技術創(chuàng)新與知識產權保護領域的重大突破,更為相關行業(yè)的數(shù)字化轉型注入了強勁動能,同時也標志著 “智嵌云” 從 V1.0 到
    的頭像 發(fā)表于 06-27 15:32 ?170次閱讀
    智嵌云<b class='flag-5'>V2.0</b>獲軟件著作權登記,賦能行業(yè)數(shù)字化升級

    使用MicroPython部署中的ocrrec_image.py推理得到的輸出結果很差,如何解決呢?

    使用在線平臺訓練OCR識別任務,測試結果表現(xiàn)很好。 期待結果和實際結果 實際的推理結果很差,
    發(fā)表于 04-29 06:54

    1.9倍性能提升!英特爾至強6在MLPerf基準測試中表現(xiàn)卓越

    與第五代至強處理器相比,英特爾至強6性能核的性能平均提高了1.9倍。 今日,MLCommons公布了最新的MLPerf推理v5.0基準測試結果,其中,英特爾??至強??6性能核處理器在
    的頭像 發(fā)表于 04-07 10:58 ?280次閱讀

    英偉達GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代

    英偉達GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代
    的頭像 發(fā)表于 03-20 15:35 ?733次閱讀

    英偉達GTC25亮點:NVIDIA Dynamo開源庫加速并擴展AI推理模型

    NVIDIA Dynamo 提高了推理性能,同時降低了擴展測試時計算 (Scaling Test-Time Compute) 的成本;在 NVIDIA Blackwell 上的推理優(yōu)化
    的頭像 發(fā)表于 03-20 15:03 ?650次閱讀

    Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理

    ——Oracle 和 NVIDIA 今日宣布,NVIDIA 加速計算和推理軟件與 Oracle 的 AI 基礎設施以及生成式 AI 服務首次實現(xiàn)集成,以幫助全球企業(yè)組織加速創(chuàng)建代理式 AI 應用。 ? 此次
    發(fā)表于 03-19 15:24 ?358次閱讀
    Oracle 與 <b class='flag-5'>NVIDIA</b> 合作助力企業(yè)加速代理式 AI <b class='flag-5'>推理</b>

    使用NVIDIA推理平臺提高AI推理性能

    NVIDIA推理平臺提高了 AI 推理性能,為零售、電信等行業(yè)節(jié)省了數(shù)百萬美元。
    的頭像 發(fā)表于 02-08 09:59 ?722次閱讀
    使用<b class='flag-5'>NVIDIA</b><b class='flag-5'>推理</b>平臺提高AI<b class='flag-5'>推理</b>性能

    WTS-100(V2.0 GNSS) 無線定位系統(tǒng)(GNSS) 彩頁

    產品概述:WTS-100(V2.0 GNSS)是一款采用國產新興窄帶高并發(fā)TurMass物聯(lián)網(wǎng)通訊技術回傳信息的無線定位系統(tǒng),系統(tǒng)通過GNSS定位終端接收來自多顆衛(wèi)星的信號來確定目標位置,具備定位
    發(fā)表于 01-17 10:59 ?0次下載

    ANSVG-G-A混合動態(tài)濾波補償裝置使用說明書 V2.0

    電子發(fā)燒友網(wǎng)站提供《ANSVG-G-A混合動態(tài)濾波補償裝置使用說明書 V2.0 .pdf》資料免費下載
    發(fā)表于 12-16 14:08 ?0次下載

    從TMS320TCI648x DSP的EDMA v2.0遷移到EDMA v3.0

    電子發(fā)燒友網(wǎng)站提供《從TMS320TCI648x DSP的EDMA v2.0遷移到EDMA v3.0.pdf》資料免費下載
    發(fā)表于 10-16 11:33 ?0次下載
    從TMS320TCI648x DSP的EDMA <b class='flag-5'>v2.0</b>遷移到EDMA <b class='flag-5'>v</b>3.0

    從EDMA v2.0遷移到TMS320DM644X DMSoC的EDMA v3.0

    電子發(fā)燒友網(wǎng)站提供《從EDMA v2.0遷移到TMS320DM644X DMSoC的EDMA v3.0.pdf》資料免費下載
    發(fā)表于 10-16 10:55 ?0次下載
    從EDMA <b class='flag-5'>v2.0</b>遷移到TMS320DM644X DMSoC的EDMA <b class='flag-5'>v</b>3.0

    從EDMA v2.0遷移到EDMA v3.0 TMS320C64X DSP

    電子發(fā)燒友網(wǎng)站提供《從EDMA v2.0遷移到EDMA v3.0 TMS320C64X DSP.pdf》資料免費下載
    發(fā)表于 10-15 10:12 ?0次下載
    從EDMA <b class='flag-5'>v2.0</b>遷移到EDMA <b class='flag-5'>v</b>3.0 TMS320C64X DSP

    阿童木二代Atom XL數(shù)字模擬對講手機用戶手冊V2.0

    阿童木二代Atom XL數(shù)字模擬對講手機用戶手冊V2.0 0119
    發(fā)表于 10-14 14:03 ?0次下載

    浪潮信息AS13000G7榮獲MLPerf? AI存儲基準測試五項性能全球第一

    北京2024年9月27日?/美通社/ -- 9月25日,MLCommons協(xié)會發(fā)布最新MLPerf? Storage v1.0 AI存儲基準測試成績。浪潮信息分布式存儲平臺AS13000G7表現(xiàn)
    的頭像 發(fā)表于 09-28 16:46 ?410次閱讀
    浪潮信息AS13000G7榮獲<b class='flag-5'>MLPerf</b>? AI存儲基準測試五項性能全球第一

    英偉達推出全新NVIDIA AI Foundry服務和NVIDIA NIM推理微服務

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務和 NVIDIA NIM 推理微服務,與同樣剛推出的 Llama 3.1 系列開源模型一起,為全球企業(yè)的生成式 AI
    的頭像 發(fā)表于 07-25 09:48 ?1062次閱讀