chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GPU加速的推薦程序框架Merlin HugeCTR

NVIDIA英偉達(dá) ? 來(lái)源:NVIDIA英偉達(dá) ? 作者:NVIDIA英偉達(dá) ? 2022-03-20 15:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Merlin HugeCTR(以下簡(jiǎn)稱 HugeCTR)是 GPU 加速的推薦程序框架,旨在在多個(gè) GPU 和節(jié)點(diǎn)之間分配訓(xùn)練并估計(jì)點(diǎn)擊率(Click-through rate)。

此次v3.4更新涉及的模塊主要為:

HugeCTR 分級(jí)參數(shù)服務(wù)器

HugeCTR Python API

相關(guān)介紹:

HugeCTR 分級(jí)參數(shù)服務(wù)器介紹

V3.4.1 版本新增內(nèi)容

調(diào)整了整個(gè)代碼庫(kù)中日志消息的日志級(jí)別。

現(xiàn)已支持對(duì)具有多個(gè)標(biāo)簽的數(shù)據(jù)集進(jìn)行推理:

“Softmax” 層現(xiàn)在已支持 FP16,并且支持混合精度以進(jìn)行多標(biāo)簽推理。

支持多 GPU 離線推理:

我們通過(guò) Python 接口支持多 GPU 離線推理,它可以利用Hierarchical Parameter Server

并在多個(gè)設(shè)備上實(shí)現(xiàn)并發(fā)執(zhí)行。更多信息請(qǐng)參考推理 API和多 GPU 離線推理筆記本。

HPS 已構(gòu)建為獨(dú)立庫(kù):

我們重構(gòu)了代碼庫(kù)并將分層參數(shù)服務(wù)器構(gòu)建為一個(gè)獨(dú)立的庫(kù),以后會(huì)進(jìn)一步封裝。

metadata.json 簡(jiǎn)介:

添加了有關(guān) Parquet data 中 _metadata.json 的詳細(xì)信息。

增加了用于估計(jì)每個(gè) GPU 的詞匯量大小的文檔和工具:

我們添加了一個(gè)工具來(lái)計(jì)算每個(gè) GPU 的不同嵌入類型的詞匯量大小,在此基礎(chǔ)上,workspace_size_per_gpu_in_mb 可以根據(jù)嵌入向量大小和優(yōu)化器類型評(píng)估更多信息請(qǐng)參考腳本:

訓(xùn)練中支持 HDFS :

a. 現(xiàn)在支持從 HDFS 加載和存儲(chǔ)模型和優(yōu)化器狀態(tài)。

b. 增加了編譯選項(xiàng)使 HDFS 的支持更加靈活。

c. 添加了一個(gè)筆記本來(lái)展示如何將 HugeCTR 與 HDFS 一起使用:

增加了一個(gè)演示如何分析模型文件的 Python 腳本和筆記本

錯(cuò)誤修復(fù):修復(fù)了SOK 中的鏡像策略錯(cuò)誤。

修復(fù)了無(wú)法在nvcr.io/nvidia/merlin/merlin-tensorflow-training:22.02 中導(dǎo)入稀疏操作工具包的問(wèn)題。

HugeCTR 參數(shù)服務(wù)器:修復(fù)了在未配置 RocksDB 時(shí),可能會(huì)在初始化期間發(fā)生的訪問(wèn)沖突問(wèn)題。

已知問(wèn)題

HugeCTR 使用 NCCL 在 rank 之間共享數(shù)據(jù),并且 NCCL 可能需要共享系統(tǒng)內(nèi)存用于 IPC 和固定(頁(yè)面鎖定)系統(tǒng)內(nèi)存資源。在容器內(nèi)使用 NCCL 時(shí),建議您通過(guò)發(fā)出以下命令(-shm-size=1g -ulimit memlock=-1) 來(lái)增加這些資源。

另見(jiàn) NCCL 的 已知問(wèn)題

還有 GitHub 問(wèn)題

目前即使目標(biāo) Kafka broker 無(wú)響應(yīng),KafkaProducers 啟動(dòng)也會(huì)成功。為了避免與來(lái)自 Kafka 的流模型更新相關(guān)的數(shù)據(jù)丟失,您必須確保有足夠數(shù)量的 Kafka brokers 啟動(dòng)、正常工作并且可以從運(yùn)行 HugeCTR 的節(jié)點(diǎn)訪問(wèn)。

文件列表中的數(shù)據(jù)文件數(shù)量應(yīng)不小于數(shù)據(jù)讀取器的數(shù)量。否則,不同的 worker 將被映射到同一個(gè)文件,從而導(dǎo)致數(shù)據(jù)加載不會(huì)按預(yù)期進(jìn)行。

正則化器暫不支持聯(lián)合損失訓(xùn)練。

原文標(biāo)題:Merlin HugeCTR v3.4.1 發(fā)布說(shuō)明

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 接口
    +關(guān)注

    關(guān)注

    33

    文章

    9444

    瀏覽量

    156143
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5099

    瀏覽量

    134461
  • 工具包
    +關(guān)注

    關(guān)注

    0

    文章

    48

    瀏覽量

    9855

原文標(biāo)題:Merlin HugeCTR v3.4.1 發(fā)布說(shuō)明

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    沐曦股份GPU加速技術(shù)助力藥物研發(fā)降本增效

    沐曦股份科學(xué)計(jì)算團(tuán)隊(duì)近期取得突破性進(jìn)展,成功將主流分子動(dòng)力學(xué)模擬引擎GROMACS中的FEP計(jì)算全流程部署于GPU執(zhí)行,并實(shí)現(xiàn)2.5倍性能提升,相關(guān)成果獲得GROMACS官方團(tuán)隊(duì)的高度認(rèn)可,該GPU
    的頭像 發(fā)表于 12-02 15:58 ?236次閱讀

    FPGA和GPU加速的視覺(jué)SLAM系統(tǒng)中特征檢測(cè)器研究

    (Nvidia Jetson Orin與AMD Versal)上最佳GPU加速方案(FAST、Harris、SuperPoint)與對(duì)應(yīng)FPGA加速方案的性能,得出全新結(jié)論。
    的頭像 發(fā)表于 10-31 09:30 ?302次閱讀
    FPGA和<b class='flag-5'>GPU</b><b class='flag-5'>加速</b>的視覺(jué)SLAM系統(tǒng)中特征檢測(cè)器研究

    PYQT 應(yīng)用程序框架及開(kāi)發(fā)工具

    大家好,本團(tuán)隊(duì)此次分享的內(nèi)容為開(kāi)發(fā)過(guò)程中使用到的PYQT 應(yīng)用程序框架及開(kāi)發(fā)工具。 pYqt 是一個(gè)多平臺(tái)的 python 圖形用戶界面應(yīng)用程序框架,由于其面向?qū)ο蟆? 易擴(kuò)展(可
    發(fā)表于 10-29 07:15

    智算加速卡是什么東西?它真能在AI戰(zhàn)場(chǎng)上干掉GPU和TPU!

    隨著AI技術(shù)火得一塌糊涂,大家都在談"大模型"、"AI加速"、"智能計(jì)算",可真到了落地環(huán)節(jié),算力才是硬通貨。你有沒(méi)有發(fā)現(xiàn),現(xiàn)在越來(lái)越多的AI企業(yè)不光用GPU,也不怎么迷信TPU了?他們嘴里多了一個(gè)新詞兒——智算加速卡。
    的頭像 發(fā)表于 06-05 13:39 ?1281次閱讀
    智算<b class='flag-5'>加速</b>卡是什么東西?它真能在AI戰(zhàn)場(chǎng)上干掉<b class='flag-5'>GPU</b>和TPU!

    可以手動(dòng)構(gòu)建imx-gpu-viv嗎?

    在 debian 10 上使用 imx gpu 交叉編譯 Qt,以便它與我的應(yīng)用程序一起工作。但是 imx-gpu-viv-6.4.3.p4.2.aarch64.bin(libGAL.so、libEGL.so
    發(fā)表于 03-28 06:35

    OpenVINO?檢測(cè)到GPU,但網(wǎng)絡(luò)無(wú)法加載到GPU插件,為什么?

    OpenVINO?安裝在舊的 Windows 10 版本 Windows? 10 (RS1) 上。 已安裝 GPU 驅(qū)動(dòng)程序版本 25.20.100.6373,檢測(cè)到 GPU,但網(wǎng)絡(luò)無(wú)法加載
    發(fā)表于 03-05 06:01

    從圖形處理到AI加速,一文看懂Imagination D系列GPU

    Imagination的D系列于2022年首次發(fā)布,見(jiàn)證了生成式AI從云端到智能手機(jī)等消費(fèi)設(shè)備中普及。在云端,由于GPU的可編程性、可擴(kuò)展性和快速處理AI工作負(fù)載的能力,GPU已成為高效的AI加速
    的頭像 發(fā)表于 02-27 08:33 ?825次閱讀
    從圖形處理到AI<b class='flag-5'>加速</b>,一文看懂Imagination D系列<b class='flag-5'>GPU</b>

    GPU加速計(jì)算平臺(tái)的優(yōu)勢(shì)

    傳統(tǒng)的CPU雖然在日常計(jì)算任務(wù)中表現(xiàn)出色,但在面對(duì)大規(guī)模并行計(jì)算需求時(shí),其性能往往捉襟見(jiàn)肘。而GPU加速計(jì)算平臺(tái)憑借其獨(dú)特的優(yōu)勢(shì),吸引了行業(yè)內(nèi)人士的廣泛關(guān)注和應(yīng)用。下面,AI部落小編為大家分享GPU
    的頭像 發(fā)表于 02-23 16:16 ?758次閱讀

    GPU 加速計(jì)算:突破傳統(tǒng)算力瓶頸的利刃

    在數(shù)字化時(shí)代,數(shù)據(jù)呈爆炸式增長(zhǎng),傳統(tǒng)的算力已難以滿足復(fù)雜計(jì)算任務(wù)的需求。無(wú)論是人工智能的深度學(xué)習(xí)、大數(shù)據(jù)的分析處理,還是科學(xué)研究中的模擬計(jì)算,都對(duì)算力提出了極高的要求。而云 GPU 加速計(jì)算的出現(xiàn)
    的頭像 發(fā)表于 02-17 10:36 ?517次閱讀

    利用NVIDIA DPF引領(lǐng)DPU加速云計(jì)算的未來(lái)

    DPU 的強(qiáng)大功能,并優(yōu)化 GPU 加速計(jì)算平臺(tái)。作為一種編排框架和實(shí)施藍(lán)圖,DPF 使開(kāi)發(fā)者、服務(wù)提供商和企業(yè)能夠無(wú)縫構(gòu)建 BlueField 加速的云原生軟件平臺(tái)。
    的頭像 發(fā)表于 01-24 09:29 ?1274次閱讀
    利用NVIDIA DPF引領(lǐng)DPU<b class='flag-5'>加速</b>云計(jì)算的未來(lái)

    OpenHarmony程序分析框架論文入選ICSE 2025

      近日,ICSE 2025軟件工程實(shí)踐Track放榜,面向OpenAtom OpenHarmony(以下簡(jiǎn)稱“OpenHarmony”)的ArkTS程序分析基礎(chǔ)框架--方舟程序分析器(論文題目為
    的頭像 發(fā)表于 01-02 13:41 ?1833次閱讀
    OpenHarmony<b class='flag-5'>程序</b>分析<b class='flag-5'>框架</b>論文入選ICSE 2025

    GPU加速云服務(wù)器怎么用的

    GPU加速云服務(wù)器是將GPU硬件與云計(jì)算服務(wù)相結(jié)合,通過(guò)云服務(wù)提供商的平臺(tái),用戶可以根據(jù)需求靈活租用帶有GPU資源的虛擬機(jī)實(shí)例。那么,GPU
    的頭像 發(fā)表于 12-26 11:58 ?849次閱讀

    SSM框架的源碼解析與理解

    MVC模式,使得開(kāi)發(fā)Web應(yīng)用程序變得更加高效和簡(jiǎn)單。 1. Spring框架 基本功能: Spring是一個(gè)開(kāi)源的Java平臺(tái),它提供了全面的基礎(chǔ)設(shè)施支持,以便開(kāi)發(fā)Java應(yīng)用程序。Spring
    的頭像 發(fā)表于 12-17 09:20 ?1419次閱讀

    《CST Studio Suite 2024 GPU加速計(jì)算指南》

    許可證模型的加速令牌或SIMULIA統(tǒng)一許可證模型的SimUnit令牌或積分授權(quán)。 4. GPU計(jì)算的啟用 - 交互式模擬:通過(guò)加速對(duì)話框啟用,打開(kāi)求解器對(duì)話框,點(diǎn)擊“加速”按鈕,打
    發(fā)表于 12-16 14:25