chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA 如何應(yīng)對會話式AI帶來的推理挑戰(zhàn)?

張慧娟 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:張慧娟 ? 2019-11-08 16:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群


NVIDIA GPU曾于去年12月和今年7月兩度樹立了數(shù)據(jù)中心神經(jīng)網(wǎng)絡(luò)訓(xùn)練的性能標(biāo)桿。今天發(fā)布的行業(yè)基準(zhǔn)測試結(jié)果顯示,NVIDIA也引領(lǐng)著數(shù)據(jù)中心內(nèi)部與外部AI網(wǎng)絡(luò)的趨勢。

NVIDIA Turing GPU和Xavier芯片系統(tǒng)在首個獨立AI推理基準(zhǔn)測試 ——MLPerf Inference 0.5中取得第一名。由于推理一直是AI市場中最大、同時也是最具競爭力的領(lǐng)域,業(yè)內(nèi)此前一直希望能夠有一套客觀的推理性能測試指標(biāo)。

在參與此次測試的十二家公司中,只有NVIDIA AI平臺提交了MLPerf的全部五項推理測試成績(MLPerf是一個于2018年5月成立的行業(yè)基準(zhǔn)測試小組)。這證明了NVIDIA CUDA-X AI和TensorRT軟件的成熟程度。它們讓用戶能夠更加輕松地將所有的NVIDIA GPU應(yīng)用于數(shù)據(jù)中心、邊緣等領(lǐng)域。

MLPerf定義了五項推理基準(zhǔn),涵蓋了三個現(xiàn)有的人工智能應(yīng)用:圖像分類、目標(biāo)檢測和翻譯。每項基準(zhǔn)分為四個場景:與數(shù)據(jù)中心應(yīng)用關(guān)聯(lián)性最高的服務(wù)器和離線場景,以及用于滿足邊緣設(shè)備地芯片系統(tǒng)需求的單流和多流場景。
圖1:NVIDIA在兩個數(shù)據(jù)中心場景(離線和服務(wù)器)的全部五項基準(zhǔn)測試中均排在第一位,Turing GPU被評為市面上單處理器性能最高的GPU。
圖2:NVIDIA Turing在MLPerf數(shù)據(jù)中心場景中的成績超過了其他市面上的處理器。

離線場景中具有代表性的場景有圖像標(biāo)記等,該場景下所有數(shù)據(jù)可在本地使用;而服務(wù)器場景代表性場景有在線翻譯服務(wù)等,此場景下會突然或間歇性隨機出現(xiàn)數(shù)據(jù)和請求工作。

Xavier在兩個邊緣場景(單流和多流)中被評為市面上性能最佳的邊緣和移動芯片系統(tǒng)。

工業(yè)檢測相機主要被用來在快速移動的生產(chǎn)線上發(fā)現(xiàn)不合格品,這是一種典型的單流任務(wù)。多流場景則是測試芯片能夠處理多少個數(shù)據(jù)源 —— 該性能對于一輛可能需要使用6臺以上攝像機的自動駕駛汽車而言,是一項關(guān)鍵的能力。
圖3:NVIDIA Xavier在MLPerf邊緣場景中成為市面上最佳的邊緣和移動芯片系統(tǒng)。

該結(jié)果顯示了NVIDIA CUDA和TensorRT軟件的性能。它們?yōu)橛脩籼峁┝艘粋€通用平臺,使用戶可以在多個產(chǎn)品和應(yīng)用中取得領(lǐng)先結(jié)果,而這正是NVIDIA所獨有的能力。

在數(shù)據(jù)中心場景中,NVIDIA的兩款GPU還出現(xiàn)了相互競爭的場面。NVIDIA TITAN RTX展示了Turing級 GPU的巨大潛力,尤其是在各種要求苛刻的任務(wù)中,比如運行用于語言翻譯的GNMT模型等。

功能豐富、應(yīng)用廣泛的NVIDIA T4 Tensor Core GPU在多個場景取得了優(yōu)秀的成績。這個功耗僅為70瓦的GPU能夠輕松安裝到任何帶有PCIe槽的服務(wù)器中,使用戶能夠根據(jù)需要擴展其計算力,進而大幅擴展其推理工作。

MLPerf已經(jīng)獲得行業(yè)和學(xué)術(shù)界的廣泛支持。其成員包括Arm、Facebook、Futurewei、通用汽車、Google、哈佛大學(xué)、Intel、MediaTek、微軟、NVIDIA及Xilinx。值得一提的是,相比于之前的兩次訓(xùn)練比賽,此次基準(zhǔn)測試吸引了更多的參與者。

NVIDIA此次共采用了三款產(chǎn)品,共計四種配置參加此次測試,并提交了全部20個場景中的19個場景的成績,以此表明公司對這項工作的支持。NVIDIA的合作伙伴Dell EMC,以及NVIDIA的客戶阿里巴巴同樣使用NVIDIA GPU提交了成績。相比于其他參與者,NVIDIA與合作伙伴和客戶一同向用戶全面地展示了NVIDIA產(chǎn)品組合的潛力。

全新的視角與產(chǎn)品

推理指的是在實時生產(chǎn)系統(tǒng)中,通過運行AI模型,從大量數(shù)據(jù)中篩選出可執(zhí)行洞察的過程。這是一項仍處于發(fā)展中的新興技術(shù),而NVIDIA也在該領(lǐng)域中不斷前進,未曾停止腳步。

今天,NVIDIA發(fā)布了用于MLPerf測試的Xavier芯片系統(tǒng)低功耗版本——Jetson Xavier NX,其最大功率僅為15瓦,卻具有最高21 TOPS的性能。它將為那些對性能要求高、但功率有限的新一代機器人、無人機和其他自主設(shè)備提供驅(qū)動力。

除了新的硬件之外,NVIDIA還發(fā)布了在MLPerf基準(zhǔn)測試中所使用的最新TensorRT 6優(yōu)化,并在GitHub上以開源方式為用戶提供該軟件。用戶可以在MLPerf 開發(fā)者博客中了解更多關(guān)于這些優(yōu)化的信息。NVIDIA不斷地對該軟件進行升級,使用戶可以從日益增加的AI自動化與性能中獲益。

讓推理變得更簡單

今天的MLPerf測試還說明了一個結(jié)論,那就是推理很困難。例如,在實際工作負載中,由于推理還需要大量預(yù)處理和后處理步驟,那么在實際工作負載中其對推理性能的需求甚至比基準(zhǔn)測試更高。

NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛在去年GTC大會的主題演講中就曾將這種復(fù)雜性概括為一個詞:PLASTER。他表示,現(xiàn)代AI推理對可編程性(Programmability)、延遲性(Latency)、準(zhǔn)確性(Accuracy)、模型大小(Accuracy)、吞吐量(Throughput)、能效(Energy efficiency)和學(xué)習(xí)率(Rate of Learning)的要求很高。

這就是為何用戶越來越喜歡使用高性能的NVIDIA GPU和軟件來處理各種要求苛刻的推理工作,其中就包括:BMW、Capital One、思科、Expedia、John Deere、微軟、PayPal、Pinterest、寶潔、Postmates、Shazam、Snap、Shopify、Twitter、Verizon和沃爾瑪?shù)葮O具遠見的公司。

本周,全球最大的郵政服務(wù)系統(tǒng)——美國郵政,也加入了此行列,使用NVIDIA GPU進行AI訓(xùn)練和推理。

硬盤制造商希捷希望通過在NVIDIA GPU上運行的AI推理將生產(chǎn)量提高10%。該公司預(yù)計,通過提高效率和質(zhì)量,其將獲得高達300%的投資回報。

Pinterest依靠NVIDIA GPU訓(xùn)練和評估其識別模型并對其1750億條Pin貼文執(zhí)行實時推理。

Snap使用NVIDIA T4加速器在谷歌云平臺上執(zhí)行推理。相比于僅采用了CPU的系統(tǒng),這提高了其廣告的效果,同時降低了成本。

Twitter發(fā)言人就這一趨勢表示:“GPU的使用不僅大大縮短了訓(xùn)練時間,還讓我們在推理時能夠?qū)崟r了解直播視頻,讓我們可以在自己的平臺上了解各媒體?!?

AI會話:關(guān)于推理

未來,會話式AI將帶來大量的機會以及技術(shù)方面的挑戰(zhàn)。NVIDIA在這一領(lǐng)域同樣是當(dāng)之無愧的領(lǐng)導(dǎo)者。

NVIDIA已經(jīng)為會話式AI服務(wù)提供了經(jīng)過優(yōu)化的參照設(shè)計,比如自動語音識別、文本-語言轉(zhuǎn)換和自然語言理解等。NVIDIA們的BERT、GNMT和Jasper等AI模型開源優(yōu)化幫助開發(fā)者實現(xiàn)頂尖推理性能。NVIDIA的客戶和合作伙伴中包括有會話式AI領(lǐng)域的一流公司,比如Kensho、微軟、Nuance、Optum等。

最后要補充的是,MLPerf小組已經(jīng)開始致力于改進其當(dāng)前的0.5推理測試。NVIDIA將努力在基準(zhǔn)測試中繼續(xù)發(fā)揮領(lǐng)導(dǎo)作用。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5149

    瀏覽量

    134739
  • 人工智能
    +關(guān)注

    關(guān)注

    1814

    文章

    49955

    瀏覽量

    263608
  • 推理
    +關(guān)注

    關(guān)注

    0

    文章

    9

    瀏覽量

    7416
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    禮來與NVIDIA宣布成立AI聯(lián)合創(chuàng)新實驗室以應(yīng)對藥物研發(fā)挑戰(zhàn)

    NVIDIA 與禮來公司在今日共同宣布,將合作成立一家開創(chuàng)性的 AI 聯(lián)合創(chuàng)新實驗室,致力于運用 AI 技術(shù)解決制藥行業(yè)長期面臨的諸多挑戰(zhàn)。
    的頭像 發(fā)表于 01-20 09:44 ?137次閱讀

    生命科學(xué)領(lǐng)先企業(yè)采用 NVIDIA BioNeMo 平臺加速 AI 驅(qū)動的藥物研發(fā)

    新聞?wù)?l 禮來與 NVIDIA 宣布成立 AI 聯(lián)合創(chuàng)新實驗室以應(yīng)對藥物研發(fā)挑戰(zhàn)。 l NVIDIA 攜手賽默飛打造自主實驗室基礎(chǔ)設(shè)施
    的頭像 發(fā)表于 01-14 11:40 ?279次閱讀
    生命科學(xué)領(lǐng)先企業(yè)采用 <b class='flag-5'>NVIDIA</b> BioNeMo 平臺加速 <b class='flag-5'>AI</b> 驅(qū)動的藥物研發(fā)

    NVIDIA 推出 Alpamayo 系列開源 AI 模型與工具,加速安全可靠的推理型輔助駕駛汽車開發(fā)

    新聞?wù)?: l NVIDIA 率先發(fā)布為應(yīng)對輔助駕駛長尾場景挑戰(zhàn)而設(shè)計的開源視覺-語言-動作推理模型(Reasoning VLA);NVIDIA
    的頭像 發(fā)表于 01-06 09:40 ?256次閱讀
    <b class='flag-5'>NVIDIA</b> 推出 Alpamayo 系列開源 <b class='flag-5'>AI</b> 模型與工具,加速安全可靠的<b class='flag-5'>推理</b>型輔助駕駛汽車開發(fā)

    什么是AI模型的推理能力

    NVIDIA 的數(shù)據(jù)工廠團隊為 NVIDIA Cosmos Reason 等 AI 模型奠定了基礎(chǔ),該模型近日在 Hugging Face 的物理推理模型排行榜中位列榜首。
    的頭像 發(fā)表于 09-23 15:19 ?1118次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)

    當(dāng)今社會,AI已經(jīng)發(fā)展很迅速了,但是你了解AI的發(fā)展歷程嗎?本章作者將為我們打開AI的發(fā)展歷程以及需求和挑戰(zhàn)的面紗。 從2017年開始生成
    發(fā)表于 09-12 16:07

    NVIDIA Nemotron Nano 2推理模型發(fā)布

    NVIDIA 正式推出準(zhǔn)確、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
    的頭像 發(fā)表于 08-27 12:45 ?1639次閱讀
    <b class='flag-5'>NVIDIA</b> Nemotron Nano 2<b class='flag-5'>推理</b>模型發(fā)布

    利用NVIDIA推理模型構(gòu)建AI智能體

    開放推理模型能夠更快、更廣泛地進行思考,為客戶服務(wù)、網(wǎng)絡(luò)安全、制造、物流和機器人等領(lǐng)域的 AI 智能體生成更明智的結(jié)果。
    的頭像 發(fā)表于 08-13 14:32 ?1476次閱讀
    利用<b class='flag-5'>NVIDIA</b><b class='flag-5'>推理</b>模型構(gòu)建<b class='flag-5'>AI</b>智能體

    信而泰×DeepSeek:AI推理引擎驅(qū)動網(wǎng)絡(luò)智能診斷邁向 “自愈”時代

    ,還是工業(yè)協(xié)議時序混亂,均可完整還原端到端業(yè)務(wù)會話鏈條,為智能分析提供堅實基礎(chǔ)。2.AI根因定位:推理引擎驅(qū)動秒級精準(zhǔn)診斷l(xiāng) 知識圖譜驅(qū)動:將網(wǎng)絡(luò)拓撲、流量統(tǒng)計、歷史趨勢、會話日志、異
    發(fā)表于 07-16 15:29

    潤和軟件發(fā)布StackRUNS異構(gòu)分布推理框架

    當(dāng)下,AI模型規(guī)模持續(xù)膨脹、多模態(tài)應(yīng)用場景日益復(fù)雜,企業(yè)正面臨異構(gòu)算力資源碎片化帶來的嚴峻挑戰(zhàn)。為應(yīng)對行業(yè)痛點,江蘇潤和軟件股份有限公司(以下簡稱“潤和軟件”)正式發(fā)布自主研發(fā)的Sta
    的頭像 發(fā)表于 06-13 09:10 ?1369次閱讀
    潤和軟件發(fā)布StackRUNS異構(gòu)分布<b class='flag-5'>式</b><b class='flag-5'>推理</b>框架

    英偉達GTC2025亮點:Oracle與NVIDIA合作助力企業(yè)加速代理式AI推理

    Oracle 數(shù)據(jù)庫與 NVIDIA AI 相集成,使企業(yè)能夠更輕松、快捷地采用代理式 AI Oracle 和 NVIDIA 宣布,NVIDIA
    的頭像 發(fā)表于 03-21 12:01 ?1304次閱讀
    英偉達GTC2025亮點:Oracle與<b class='flag-5'>NVIDIA</b>合作助力企業(yè)加速代理式<b class='flag-5'>AI</b><b class='flag-5'>推理</b>

    英偉達GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代

    英偉達GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代
    的頭像 發(fā)表于 03-20 15:35 ?1329次閱讀

    英偉達GTC25亮點:NVIDIA Dynamo開源庫加速并擴展AI推理模型

    DeepSeek-R1 上的吞吐量提高了 30 倍 NVIDIA 發(fā)布了開源推理軟件 NVIDIA Dynamo,旨在以高效率、低成本加速并擴展 AI 工廠中的
    的頭像 發(fā)表于 03-20 15:03 ?1145次閱讀

    Oracle 與 NVIDIA 合作助力企業(yè)加速代理式 AI 推理

    ——Oracle 和 NVIDIA 今日宣布,NVIDIA 加速計算和推理軟件與 Oracle 的 AI 基礎(chǔ)設(shè)施以及生成
    發(fā)表于 03-19 15:24 ?515次閱讀
    Oracle 與 <b class='flag-5'>NVIDIA</b> 合作助力企業(yè)加速代理式 <b class='flag-5'>AI</b> <b class='flag-5'>推理</b>

    NVIDIA 推出開放推理 AI 模型系列,助力開發(fā)者和企業(yè)構(gòu)建代理式 AI 平臺

    NVIDIA 后訓(xùn)練的全新 Llama Nemotron 推理模型,為代理式 AI 提供業(yè)務(wù)就緒型基礎(chǔ) 埃森哲、Amdocs、Atlassian、Box、Cadence、CrowdStrike
    發(fā)表于 03-19 09:31 ?360次閱讀
    <b class='flag-5'>NVIDIA</b> 推出開放<b class='flag-5'>推理</b> <b class='flag-5'>AI</b> 模型系列,助力開發(fā)者和企業(yè)構(gòu)建代理式 <b class='flag-5'>AI</b> 平臺

    使用NVIDIA推理平臺提高AI推理性能

    NVIDIA推理平臺提高了 AI 推理性能,為零售、電信等行業(yè)節(jié)省了數(shù)百萬美元。
    的頭像 發(fā)表于 02-08 09:59 ?1568次閱讀
    使用<b class='flag-5'>NVIDIA</b><b class='flag-5'>推理</b>平臺提高<b class='flag-5'>AI</b><b class='flag-5'>推理</b>性能