chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

最新測(cè)試:NVIDIA的安培GPU測(cè)試性能是最先進(jìn) CPU的237倍

如意 ? 來(lái)源:雷鋒網(wǎng) ? 作者:包永剛 ? 2020-10-23 09:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

MLPerf組織今天發(fā)布最新的推理基準(zhǔn)測(cè)試(Benchmark)MLPerf Inference v0.7結(jié)果,總共有23個(gè)組織提交了結(jié)果,相比上一個(gè)版本(MLPerf Inference v0.5)的12個(gè)提交者增加了近一倍。

結(jié)果顯示,今年5月NVIDIA(Nvidia)發(fā)布的安培(Ampere)架構(gòu)A100 Tensor Core GPU,在云端推理的基準(zhǔn)測(cè)試性能是最先進(jìn)Intel CPU的237倍。

最新測(cè)試:NVIDIA的安培GPU測(cè)試性能是最先進(jìn) CPU的237倍

MLPerf Inference V0.7部分結(jié)果截圖

最新的AI推理測(cè)試結(jié)果意味著,NVIDIA未來(lái)可能在AI推理和訓(xùn)練市場(chǎng)都占據(jù)領(lǐng)導(dǎo)地位,給云端AI推理市場(chǎng)擁有優(yōu)勢(shì)的Intel帶來(lái)更大壓力的同時(shí),也將讓其他追趕者面臨更大挑戰(zhàn)。

MLPerf推理基準(zhǔn)測(cè)試進(jìn)一步完善的價(jià)值

與2019年的MLPerf Inference v0.5版本相比,最新的0.7版本將測(cè)試從AI研究的核心視覺(jué)和語(yǔ)言的5項(xiàng)測(cè)試,擴(kuò)展了到了包括推薦系統(tǒng)、自然語(yǔ)言理解、語(yǔ)音識(shí)別和醫(yī)療影像應(yīng)用的6項(xiàng)測(cè)試,并且有分別針對(duì)云端和終端推理的測(cè)試,還加入了手機(jī)和筆記本電腦的結(jié)果。

擴(kuò)展的測(cè)試項(xiàng)從MLPerf和業(yè)界兩個(gè)角度都有積極意義。

最新測(cè)試:NVIDIA的安培GPU測(cè)試性能是最先進(jìn) CPU的237倍

任何一個(gè)基準(zhǔn)測(cè)試都需要給業(yè)界具有參考價(jià)值的指標(biāo)。MLPerf基準(zhǔn)測(cè)試是在業(yè)界缺乏對(duì)AI芯片公認(rèn)的評(píng)價(jià)標(biāo)準(zhǔn)的2018年誕生,因此,MLPerf組織既需要給出各方都認(rèn)可的成績(jī),還需要根據(jù)AI行業(yè)的發(fā)展完善評(píng)價(jià)標(biāo)準(zhǔn)。

不過(guò),AI行業(yè)發(fā)展迅速,AI模型的參數(shù)越來(lái)越多,應(yīng)用的場(chǎng)景也越來(lái)越廣泛。評(píng)價(jià)AI芯片和系統(tǒng)的推理性能需要涵蓋可編程性、延遲、準(zhǔn)確性、模型大小、吞吐量、能效等指標(biāo),也需要選擇更具指導(dǎo)價(jià)值的模型和應(yīng)用。

此次增加的推薦系統(tǒng)測(cè)試對(duì)于互聯(lián)網(wǎng)公司意義重大。在王喆的《深度學(xué)習(xí)推薦系統(tǒng)》一書(shū)中提到,2019年天貓“雙11”的成交額是2684億元,假設(shè)推薦系統(tǒng)進(jìn)行了優(yōu)化,整體的轉(zhuǎn)化率提高1%,那么增加的成交額大約為26.84億元。

另外,MLPerf Inference v0.7中增加醫(yī)療影像3D U-Net模型測(cè)試與新冠大流行以及AI在醫(yī)療行業(yè)的重要性與日俱增密切相關(guān),比如一家初創(chuàng)公司使用AI簡(jiǎn)化了超聲心電圖的采集工作,在新冠大流行初期發(fā)揮了作用。

基準(zhǔn)測(cè)試從v0.5到v0.7,能夠?yàn)橐x用AI芯片和系統(tǒng)的公司提供更直觀和有價(jià)值的參考是MLPerf基準(zhǔn)測(cè)試的價(jià)值所在,比如,幫助金融結(jié)構(gòu)的會(huì)話式AI更快速回答客戶(hù)問(wèn)題,幫助零售商使用AI保證貨架庫(kù)存充足。

與此同時(shí),這也將促進(jìn)MLPerf組織在業(yè)界的受認(rèn)可程度,從接近翻倍的提交成績(jī)的組織就能看出來(lái)。

GPU云端推理性能最高是CPU的237倍

過(guò)去幾年,云端AI訓(xùn)練市場(chǎng)NVIDIA擁有絕對(duì)優(yōu)勢(shì),云端AI推理市場(chǎng)被Intel賺取了大部分利潤(rùn)是事實(shí)。這讓不少人都產(chǎn)生了GPU更適合訓(xùn)練而CPU更適合推理的認(rèn)知,但MLPerf最新的推理測(cè)試結(jié)果可能會(huì)改變這一觀點(diǎn)。

MLPerf Inference V0.7的測(cè)試結(jié)果顯示,在數(shù)據(jù)中心OFFLINE(離線)測(cè)試模式下,賽靈思U250和IntelCooper Lake在各個(gè)測(cè)試模型下與NVIDIAT4的差距不大,但A100對(duì)比CPU、FPGA和自家的T4就有明顯的性能差距。

在SERVER模式下的推薦系統(tǒng)DLRM模型下,A100 GPU對(duì)比IntelCooper Lake有最高237倍的性能差距,在其他模型下也有比較顯著的差距。值得注意的是,Intel的Cooper Lake系統(tǒng)的狀態(tài)還是預(yù)覽,其余三款芯片的系統(tǒng)都已經(jīng)可用。

A100 GPU的優(yōu)勢(shì)也在邊緣推理中也十分明顯。在單數(shù)據(jù)流(Singel-Stream)測(cè)試中,A100對(duì)比NVIDIAT4和面向邊緣終端的NVIDIAJetson AGX Xavier有幾倍到十幾倍的性能優(yōu)勢(shì)。在多數(shù)據(jù)流(Multi-Stream)測(cè)試中,A100對(duì)比另外兩款自家產(chǎn)品在不同AI模型中有幾倍到二十多倍的性能優(yōu)勢(shì)。

在邊緣OFFLINE模式下,A100對(duì)比T4和Jetson AGX Xavier也有幾倍到二十多倍的性能優(yōu)勢(shì)。

這很好地說(shuō)明A100的安培架構(gòu)以及其第三代Tensor Core優(yōu)勢(shì)的同時(shí),也表明了NVIDIA能夠覆蓋整個(gè)AI推理市場(chǎng)。

在此次提交結(jié)果的23家公司中,除了NVIDIA外還有11家其合作伙伴提交了基于NVIDIA GPU的1029個(gè)測(cè)試結(jié)果,占數(shù)據(jù)中心和邊緣類(lèi)別中參評(píng)測(cè)試結(jié)果總數(shù)的85%以上。

從提交結(jié)果的合作伙伴的系統(tǒng)中可以看到,NVIDIAT4仍然是企業(yè)的邊緣服務(wù)器推理平臺(tái)的主要選擇。A100提升到新高度的性能意味著未來(lái)企業(yè)邊緣服務(wù)器在選擇AI推理平臺(tái)的時(shí)候,可以從T4升級(jí)到A100,對(duì)于功耗受限的設(shè)備,可以選擇Jeston系列產(chǎn)品。

特別值得注意的是,NVIDIA GPU首次在公有云中實(shí)現(xiàn)了超越CPU的AI推理能力。

臨界點(diǎn)到來(lái)?AI推理芯片市場(chǎng)競(jìng)爭(zhēng)門(mén)檻更高

五年前,只有少數(shù)領(lǐng)先的高科技公司使用GPU進(jìn)行推理。如今,NVIDIAGPU首次在公有云市場(chǎng)實(shí)現(xiàn)超越CPU的AI推理能力,或許意味著AI推理市場(chǎng)臨界點(diǎn)的到來(lái)。NVIDIA還預(yù)測(cè),基于其GPU的總體云端AI推理計(jì)算能力每?jī)赡暝鲩L(zhǎng)約10倍,增長(zhǎng)速度高于CPU。

另外,NVIDIA還強(qiáng)調(diào)基于A100高性能系統(tǒng)的成本效益。NVIDIA表示,一套DGX A100系統(tǒng)可以提供相當(dāng)于近1000臺(tái)雙插槽CPU服務(wù)器的性能,能為客戶(hù)AI推薦系統(tǒng)模型從研發(fā)走向生產(chǎn)的過(guò)程,具有極高的成本效益。

同時(shí),NVIDIA也在不斷優(yōu)化推理軟件堆棧,進(jìn)一步提升在推理市場(chǎng)的競(jìng)爭(zhēng)力。

最先感受到影響的會(huì)是Intel,但在云端AI推理市場(chǎng)體現(xiàn)出顯著變化至少需要幾年時(shí)間,因?yàn)槠髽I(yè)在更換平臺(tái)的時(shí)候會(huì)更加謹(jǐn)慎,生態(tài)的護(hù)城河此時(shí)也更能體現(xiàn)出價(jià)值。

但無(wú)論如何,我們都看到NVIDIA在AI市場(chǎng)的強(qiáng)勢(shì)地位。雷鋒網(wǎng)七月底報(bào)道,在MLPerf發(fā)布的MLPerf Training v0.7基準(zhǔn)測(cè)試中,A100 Tensor Core GPU,和HDR InfiniBand實(shí)現(xiàn)多個(gè)DGX A100 系統(tǒng)互聯(lián)的龐大集群DGX SuperPOD系統(tǒng)在性能上開(kāi)創(chuàng)了八個(gè)全新里程碑,共打破16項(xiàng)紀(jì)錄。

安培架構(gòu)A100在MLPerf最新的訓(xùn)練和推理成績(jī)表明NVIDIA不僅給云端AI訓(xùn)練的競(jìng)爭(zhēng)者更大的壓力,也可能改變AI推理市場(chǎng)的格局。

NVIDIA將其在云端訓(xùn)練市場(chǎng)的優(yōu)勢(shì)進(jìn)一步拓展到云端和邊緣推理市場(chǎng)符合AI未來(lái)的發(fā)展趨勢(shì)。有預(yù)測(cè)指出,隨著AI模型的成熟,市場(chǎng)對(duì)云端AI訓(xùn)練需求的增速將會(huì)降低,云端AI推理的市場(chǎng)規(guī)模將會(huì)迅速增加,并有望在2022年超過(guò)訓(xùn)練市場(chǎng)。

另?yè)?jù)市場(chǎng)咨詢(xún)公司ABI Research的數(shù)據(jù),預(yù)計(jì)到2025年,邊緣AI芯片市場(chǎng)收入將達(dá)到122億美元,云端AI芯片市場(chǎng)收入將達(dá)到119億美元,邊緣AI芯片市場(chǎng)將超過(guò)云端AI芯片市場(chǎng)。

憑借強(qiáng)大的軟硬件生態(tài)系統(tǒng),NVIDIA和Intel依舊會(huì)是AI市場(chǎng)的重要玩家,只是隨著他們競(jìng)爭(zhēng)力的不斷提升,其他參與AI市場(chǎng)競(jìng)爭(zhēng)的AI芯片公司們面臨的壓力也隨之增加。
責(zé)編AJX

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11223

    瀏覽量

    223022
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5496

    瀏覽量

    109119
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5102

    瀏覽量

    134485
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA RTX PRO 2000 Blackwell GPU性能測(cè)試

    越來(lái)越多的應(yīng)用正在使用 AI 加速,而無(wú)論工作站的大小或形態(tài)如何,都有越來(lái)越多的用戶(hù)需要 AI 性能NVIDIA RTX PRO 2000 Blackwell 是全新 NVIDIA
    的頭像 發(fā)表于 11-28 09:39 ?3924次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 2000 Blackwell <b class='flag-5'>GPU</b><b class='flag-5'>性能</b><b class='flag-5'>測(cè)試</b>

    NVIDIA RTX PRO 4500 Blackwell GPU測(cè)試分析

    今天我們帶來(lái)全新 NVIDIA Blackwell 架構(gòu) GPU —— NVIDIA RTX PRO 4500 Blackwell 的測(cè)試,對(duì)比上一代產(chǎn)品
    的頭像 發(fā)表于 08-28 11:02 ?3001次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 4500 Blackwell <b class='flag-5'>GPU</b><b class='flag-5'>測(cè)試</b>分析

    NVIDIA桌面GPU系列擴(kuò)展新產(chǎn)品

    NVIDIA 桌面 GPU 系列擴(kuò)展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell
    的頭像 發(fā)表于 08-18 11:50 ?1019次閱讀

    PCIe協(xié)議分析儀能測(cè)試哪些設(shè)備?

    :提升數(shù)據(jù)中心的整體效率,降低CPU負(fù)載。 四、異構(gòu)計(jì)算與擴(kuò)展設(shè)備 多GPU系統(tǒng) 測(cè)試場(chǎng)景:利用PCIe協(xié)議分析儀模擬高負(fù)載的GPU間通信,測(cè)試
    發(fā)表于 07-25 14:09

    NVIDIA Blackwell GPU優(yōu)化DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場(chǎng)景中的性能紀(jì)錄

    本文將探討 NVIDIA TensorRT-LLM 如何基于 8 個(gè) NVIDIA Blackwell GPU 的配置,打破 DeepSeek-R1 在最小延遲場(chǎng)景中的性能紀(jì)錄:在 G
    的頭像 發(fā)表于 07-02 19:31 ?2964次閱讀
    <b class='flag-5'>NVIDIA</b> Blackwell <b class='flag-5'>GPU</b>優(yōu)化DeepSeek-R1<b class='flag-5'>性能</b> 打破DeepSeek-R1在最小延遲場(chǎng)景中的<b class='flag-5'>性能</b>紀(jì)錄

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】+NVlink技術(shù)從應(yīng)用到原理

    。。) 原理學(xué)習(xí) 在「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」書(shū)中,作者詳解了從帕斯卡架構(gòu)到40系的Hopper架構(gòu)的技術(shù)演變進(jìn)化,按照出版時(shí)間算是囊括了NVIDIA
    發(fā)表于 06-18 19:31

    1.9性能提升!英特爾至強(qiáng)6在MLPerf基準(zhǔn)測(cè)試中表現(xiàn)卓越

    與第五代至強(qiáng)處理器相比,英特爾至強(qiáng)6性能核的性能平均提高了1.9。 今日,MLCommons公布了最新的MLPerf推理v5.0基準(zhǔn)測(cè)試結(jié)果,其中,英特爾??至強(qiáng)??6
    的頭像 發(fā)表于 04-07 10:58 ?524次閱讀

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI開(kāi)發(fā)

    NVIDIA GTC 推出新一代專(zhuān)業(yè)級(jí) GPU 和 AI 賦能的開(kāi)發(fā)者工具—同時(shí),ChatRTX 更新現(xiàn)已支持 NVIDIA NIM,RTX Remix 正式結(jié)束測(cè)試階段,本月的
    的頭像 發(fā)表于 03-28 09:59 ?1085次閱讀

    比斯特電池組綜合性能測(cè)試機(jī):基于先進(jìn)技術(shù)的性能優(yōu)勢(shì)展現(xiàn)

    在鋰電池測(cè)試設(shè)備的領(lǐng)域中,比斯特BT-100V20C100F 電池組綜合性能測(cè)試機(jī)憑借其基于先進(jìn)技術(shù)構(gòu)建的強(qiáng)大性能優(yōu)勢(shì),脫穎而出,成為了行業(yè)
    的頭像 發(fā)表于 03-07 09:49 ?521次閱讀
    比斯特電池組綜合<b class='flag-5'>性能</b><b class='flag-5'>測(cè)試</b>機(jī):基于<b class='flag-5'>先進(jìn)</b>技術(shù)的<b class='flag-5'>性能</b>優(yōu)勢(shì)展現(xiàn)

    NVIDIA推出GeForce RTX 50系列臺(tái)式機(jī)和筆記本電腦GPU

    NVIDIA 宣布為游戲玩家、創(chuàng)作者和開(kāi)發(fā)者推出最先進(jìn)的消費(fèi)級(jí) GPU——GeForce RTX 50 系列臺(tái)式機(jī)和筆記本電腦 GPU
    的頭像 發(fā)表于 01-08 11:05 ?1408次閱讀

    Advantest CEO:先進(jìn)芯片測(cè)試需求大增

    技術(shù)的不斷進(jìn)步,現(xiàn)代先進(jìn)芯片在測(cè)試方面的需求較以往有了大幅提升。他透露,目前最先進(jìn)的芯片從晶圓切割到成品組裝的全流程中,需要經(jīng)過(guò)Advantest設(shè)備10~20道的測(cè)試。而在五年前,這
    的頭像 發(fā)表于 01-03 14:26 ?842次閱讀

    如何測(cè)試電子開(kāi)關(guān)的性能

    測(cè)試電子開(kāi)關(guān)的性能是確保其質(zhì)量和可靠性的重要環(huán)節(jié)。以下是一些常用的測(cè)試方法和步驟: 一、基本性能測(cè)試 標(biāo)志檢查 :確保產(chǎn)品有清晰的標(biāo)志和說(shuō)明
    的頭像 發(fā)表于 12-30 14:55 ?1790次閱讀

    華為云 X 實(shí)例 CPU 性能測(cè)試詳解與優(yōu)化策略

    引言 ? 1. 測(cè)試環(huán)境搭建 ? 1.1 測(cè)試實(shí)例的選擇 ? 1.2 CPU性能測(cè)試工具介紹 ? 1.3 安裝和配置Sysbench ? 2
    的頭像 發(fā)表于 12-30 14:52 ?1218次閱讀
    華為云 X 實(shí)例 <b class='flag-5'>CPU</b> <b class='flag-5'>性能</b><b class='flag-5'>測(cè)試</b>詳解與優(yōu)化策略

    解鎖NVIDIA TensorRT-LLM的卓越性能

    Batching、Paged KV Caching、量化技術(shù) (FP8、INT4 AWQ、INT8 SmoothQuant 等) 以及更多功能,確保您的 NVIDIA GPU 能發(fā)揮出卓越的推理性能
    的頭像 發(fā)表于 12-17 17:47 ?1621次閱讀

    《CST Studio Suite 2024 GPU加速計(jì)算指南》

    問(wèn)題,但會(huì)降低舊GPU硬件性能,可通過(guò)NVIDIA控制面板或命令行工具nvidia - smi管理。 - TCC模式(Windows only):某些
    發(fā)表于 12-16 14:25