chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA RAPIDS 25.06版本新增多項功能

NVIDIA英偉達企業(yè)解決方案 ? 來源:NVIDIA英偉達企業(yè)解決方案 ? 2025-09-09 09:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

RAPIDS 是一套面向 Python 數(shù)據(jù)科學(xué)的 NVIDIA CUDA-X 庫,最新發(fā)布的 25.06 版本引入了多項亮眼新功能,其中包括 Polars GPU 流執(zhí)行引擎——這是一種面向圖神經(jīng)網(wǎng)絡(luò)(GNN)的統(tǒng)一 API,以及無需更改代碼即可實現(xiàn)的支持向量機加速功能。在本篇博客中,我們將介紹其中的幾項重要更新。

Polars GPU 引擎更新

2024 年 9 月,NVIDIA 與 Polars 團隊合作推出了基于 NVIDIA cuDF 開發(fā)的 Polars GPU 引擎。此次發(fā)布的 25.06 版對 Polars GPU 引擎的功能進行了重大更新。

流執(zhí)行器現(xiàn)已進入實驗階段

25.06 版在 Polars GPU 引擎中引入了流執(zhí)行功能。流執(zhí)行器利用數(shù)據(jù)分區(qū)和并行處理技術(shù),能夠處理超出顯存容量的數(shù)據(jù)集。要使用這個新的流執(zhí)行器,用戶可以將恰當配置的 GPUEngine 對象傳遞給 Polars 的 collect 調(diào)用。

這種新的流模式還能讓用戶將數(shù)據(jù)處理工作流擴展到多個 GPU,有助于加速分析數(shù)百 GB 到 TB 級的數(shù)據(jù)集。對于需要在分區(qū)之間移動數(shù)據(jù)的操作(例如連接和分組),新引入的數(shù)據(jù)混洗(shuffle)機制可在設(shè)備之間重新分配數(shù)據(jù)。多 GPU 執(zhí)行通過 Dask 分布式調(diào)度器進行編排,使用前需要先設(shè)置一個 Dask 客戶端。

流執(zhí)行器目前仍在積極開發(fā)中,尚未支持的操作將自動回退到內(nèi)存執(zhí)行器。

支持滾動聚合及更多列操作

最新版本還包含了對 Polars GPU 引擎中一些關(guān)鍵新 DataFrame 功能的支持。首先,我們在 Polars 中添加了對 .rolling() 操作的支持,允許用戶基于一些 DataFrame 中的其他列創(chuàng)建滾動組。這在處理時間序列數(shù)據(jù)集時尤為實用。

此外 GPU 引擎現(xiàn)在支持更豐富的日期時間列表達式,目前已支持的新方法包括 .strftime() 和 .cast_time_unit()。隨著我們繼續(xù)擴展整體 API 覆蓋范圍,未來版本還將支持更多方法。

統(tǒng)一的 GNN API

NVIDIA cuGraph-PyG 進一步集成了 WholeGraph 以加速特征提取,形成了我們所說的統(tǒng)一 API。這個新 API 現(xiàn)在允許用戶在單 GPU 工作流中使用 WholeGraph 的加速特征存儲,同時無需修改腳本即可用于多 GPU 或多節(jié)點工作流。

借助統(tǒng)一 API,在單 GPU 上進行原型開發(fā)時使用相同的 GNN 訓(xùn)練腳本就能在具有多個 GPU 的單節(jié)點以及多節(jié)點上運行。通過 PyTorch 的 torchrun 命令管理進程設(shè)置,使得大多數(shù) PyTorch 用戶都可以熟練地使用統(tǒng)一 API。

無需更改代碼的 cuML 增強功能

今年 3 月,NVIDIA 推出了由 cuML 驅(qū)動、用于 scikit-learn 的無需更改代碼的加速器,該加速器已進入公測階段。在 25.06 版本中,cuML 為用戶帶來了更多無需更改代碼的功能。

無需更改代碼的支持向量機

NVIDIA cuML 擴展了其無需更改代碼的加速功能,新增了對支持向量機的支持。支持向量分類(SVC)和支持向量回歸(SVR)這兩種強大的算法在 GPU 上執(zhí)行時,能很好地處理高維數(shù)據(jù)并顯著地提升速度。通過在 cuML 的零代碼變更接口中添加這些估計器,利用支持向量機的現(xiàn)有 scikit-learn 工作流無需修改即可加速。cuML 和 scikit-learn 在 SVC 和 SVR 的實現(xiàn)上存在一些關(guān)鍵差異,還請用戶加以了解。

改進的 scikit-learn 兼容性

25.06 版本對 cuML 加速 scikit-learn 估計器的方式進行了重大重構(gòu),增強了 scikit-learn 一致性,還改進了參數(shù)驗證和異常處理。此外,通過這次重新設(shè)計,cuML 也增強了與 scikit-learn API 的兼容性,可以更輕松地加速目前與 scikit-learn 集成的第三方庫。

隨機森林與更新后的森林推理庫(FIL)集成

通過集成更快、更強大的森林推理庫(FIL),cuML 的隨機森林估計器得到了升級,在保持向后兼容性的同時,提供了更高的性能和更好的內(nèi)存管理。

需注意,舊版特有的一些 API 調(diào)節(jié)參數(shù)(knobs)現(xiàn)已棄用,并將在即將發(fā)布的 25.08 版本中移除。

RAPIDS 內(nèi)存管理器與NVIDIABlackwell 解壓縮引擎的兼容性

RAPIDS 內(nèi)存管理器(RMM)庫增加了全新功能,確保用戶能夠使用最新的 NVIDIA 硬件功能。在最新版本中,RMM 異步內(nèi)存資源可支持兼容 NVIDIA Blackwell GPU 上基于硬件的解壓縮引擎,讓 IO 密集型工作流中的性能得到提升。

此外,RMM 現(xiàn)在以一個預(yù)編譯共享庫的形式存在,取代了之前的僅包含頭文件的庫。我們相信這一變化將為未來解鎖新功能奠定基礎(chǔ)。

平臺更新:Python 和NVIDIA CUDA 支持

25.06 版本為所有 RAPIDS 庫添加了對 Python 3.13 的支持,同時也是最后一個支持 CUDA 11 的版本。從 25.08 版開始,RAPIDS 將不再支持 CUDA 11。如需繼續(xù)使用 CUDA 11,可以固定使用 25.06 版本。

結(jié)語

RAPIDS 25.06 版為新的機器學(xué)習算法帶來了零代碼變更功能、新的 Polars GPU 流引擎、異步內(nèi)存資源的硬件解壓縮功能等多項功能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5431

    瀏覽量

    108281
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5036

    瀏覽量

    133748
  • 引擎
    +關(guān)注

    關(guān)注

    1

    文章

    367

    瀏覽量

    23310

原文標題:RAPIDS 新增 GPU Polars 流執(zhí)行等多項新功能

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    開鴻Bot系列大版本更新:體驗穩(wěn)定升級,樂享高效協(xié)同!

    V5.0.1.22版本開鴻Bot系列今日,開鴻Bot系列迎來第二次大版本更新——V5.0.1.22。此次版本更新致力于進一步提升系統(tǒng)穩(wěn)定性與用戶體驗,新增多項實用
    的頭像 發(fā)表于 09-26 17:06 ?983次閱讀
    開鴻Bot系列大<b class='flag-5'>版本</b>更新:體驗穩(wěn)定升級,樂享高效協(xié)同!

    匠芯創(chuàng)發(fā)布新版GUI開發(fā)工具 新增多國語言設(shè)置等功能

    。此次版本更新,為用戶帶來了諸多實用的新功能,進一步提升了設(shè)計體驗和開發(fā)效率。在V1.3.0版本中,AiUIBuilder新增了多國語言切換功能
    的頭像 發(fā)表于 08-07 15:36 ?739次閱讀
    匠芯創(chuàng)發(fā)布新版GUI開發(fā)工具 <b class='flag-5'>新增多</b>國語言設(shè)置等<b class='flag-5'>功能</b>

    匠芯創(chuàng)發(fā)布新版GUI開發(fā)工具 新增多國語言設(shè)置等功能

    。此次版本更新,為用戶帶來了諸多實用的新功能,進一步提升了設(shè)計體驗和開發(fā)效率。 在V1.3.0版本中,AiUIBuilder新增了 多國語言切換功能
    發(fā)表于 07-16 13:54

    NVIDIA DOCA 3.0版本的亮點解析

    NVIDIA DOCA 框架已發(fā)展成為新一代 AI 基礎(chǔ)設(shè)施的重要組成部分。從初始版本到備受期待的 NVIDIA DOCA 3.0 發(fā)布,每個版本都擴展了
    的頭像 發(fā)表于 07-04 14:27 ?713次閱讀
    <b class='flag-5'>NVIDIA</b> DOCA 3.0<b class='flag-5'>版本</b>的亮點解析

    CANoe產(chǎn)品體系19版本新特性及新增Option(上)

    版本持續(xù)助力當前車輛E/E架構(gòu)中ECU開發(fā)驗證,同時賦能后續(xù)智能網(wǎng)聯(lián)電動車型預(yù)研驗證。新版本CANoe產(chǎn)品體系新增數(shù)據(jù)驅(qū)動的DDS、車輛互聯(lián)服務(wù)和高效電機模型庫,進一步支持CANXL
    的頭像 發(fā)表于 06-11 10:03 ?2256次閱讀
    CANoe產(chǎn)品體系19<b class='flag-5'>版本</b>新特性及<b class='flag-5'>新增</b>Option(上)

    NVIDIA在ICRA 2025展示多項最新研究成果

    在亞特蘭大舉行的國際機器人與自動化大會 (ICRA) 上,NVIDIA 展示了其在生成式 AI、仿真和自主操控領(lǐng)域的多項研究成果。
    的頭像 發(fā)表于 06-06 14:56 ?932次閱讀

    NVIDIA虛擬GPU 18.0版本的亮點

    NVIDIA 虛擬 GPU(vGPU)技術(shù)可在虛擬桌面基礎(chǔ)設(shè)施(VDI)中解鎖 AI 功能,使其比以往更加強大、用途更加廣泛。vGPU 通過為各種虛擬化環(huán)境中的 AI 驅(qū)動工作負載提供動力,提高了
    的頭像 發(fā)表于 04-07 11:28 ?952次閱讀

    Sapphire Rapids與OpenVINO?工具套件是否兼容?

    無法確定 Sapphire Rapids 與 OpenVINO? 工具套件的兼容性
    發(fā)表于 03-05 06:55

    SOLIDWORKS 2025引入了多項新增工具和增強功能

    在工程設(shè)計領(lǐng)域,SOLIDWORKS一直以其強大的功能和靈活的操作性贏得了廣泛的認可。隨著SOLIDWORKS 2025版本的發(fā)布,這款三維CAD設(shè)計軟件再次以一系列令人矚目的新增工具和增強
    的頭像 發(fā)表于 12-17 15:23 ?956次閱讀

    NVIDIA DOCA 2.9版本的亮點解析

    NVIDIA DOCA通過為開發(fā)者提供全面的軟件框架以利用硬件加速來增強 NVIDIA 網(wǎng)絡(luò)平臺的功能,從而提高性能、安全性和效率。其 API、庫和工具生態(tài)系統(tǒng)簡化了數(shù)據(jù)中心基礎(chǔ)設(shè)施的開發(fā),實現(xiàn)了工作負載卸載、加速和隔離,以支持
    的頭像 發(fā)表于 11-27 11:15 ?1198次閱讀
    <b class='flag-5'>NVIDIA</b> DOCA 2.9<b class='flag-5'>版本</b>的亮點解析

    RAPIDS cuDF將pandas提速近150倍

    NVIDIA GTC 2024 上,NVIDIA 宣布,RAPIDS cuDF 當前已能夠為 950 萬 pandas 用戶帶來 GPU 加速,且無需修改代碼。
    的頭像 發(fā)表于 11-20 09:52 ?948次閱讀
    <b class='flag-5'>RAPIDS</b> cuDF將pandas提速近150倍

    NVIDIA Research在ECCV 2024上展示多項創(chuàng)新成果

    在米蘭舉行的歐洲計算機視覺國際會議 (ECCV) 上,NVIDIA Research 展示了多項突破性的創(chuàng)新成果,共發(fā)表了 14 篇論文。
    的頭像 發(fā)表于 11-19 15:07 ?1007次閱讀

    英國比克新推出了PicoScope7軟件的穩(wěn)定新版本

    兼容性的更新,為用戶帶來更加流暢和高效的使用體驗。PicoScope7.1.39版本新增功能包括:1、注釋功能:用戶可以在圖形內(nèi)添加說明,并通過箭頭突出顯示和解
    的頭像 發(fā)表于 11-09 01:08 ?1002次閱讀
    英國比克新推出了PicoScope7軟件的穩(wěn)定新<b class='flag-5'>版本</b>

    Linux微信4.0.0版發(fā)布,功能再升級

    近日,備受矚目的Linux微信4.0.0版本終于迎來了正式發(fā)布。此次版本更新不僅帶來了多項實用功能,還實現(xiàn)了與Windows、macOS公測版本
    的頭像 發(fā)表于 11-06 10:59 ?1137次閱讀

    淺談Xpedition 2409版本的新功能

    在《創(chuàng)新不止|Xpedition 2409版本功能揭秘(上)》一文中,我們了解了Xpedition 2409版本的部分改進部分。今天,我們繼續(xù)看Xpedition 2409新版本給我
    的頭像 發(fā)表于 10-31 15:33 ?3893次閱讀