chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用NVIDIA RAPIDS cuDF加速預(yù)處理工作流

NVIDIA英偉達 ? 來源:NVIDIA英偉達 ? 2024-11-19 15:58 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文屬于《解碼 AI》系列欄目,該系列的目的是讓技術(shù)更加簡單易懂,從而解密 AI,同時向 RTX 工作站和 PC 用戶展示全新硬件、軟件、工具和加速特性。

AI 正幫助各行各業(yè)推動創(chuàng)新和提高效率,但要充分發(fā)揮其潛力,必須基于海量的高質(zhì)量數(shù)據(jù)對各種模型進行訓(xùn)練。數(shù)據(jù)科學家在準備這類數(shù)據(jù)方面發(fā)揮著關(guān)鍵作用,在專業(yè)數(shù)據(jù)(通常為專有數(shù)據(jù))對于增強 AI 功能至關(guān)重要的特定領(lǐng)域尤其如此。

為了幫助數(shù)據(jù)科學家應(yīng)對日益增長的工作負載需求,NVIDIA 發(fā)布了 RAPIDS cuDF 庫,以便用戶更輕松地處理數(shù)據(jù),并且無需更改代碼即可加速 pandas 軟件庫。Pandas 是面向 Python 的一個靈活、功能強大的熱門數(shù)據(jù)分析和處理庫。借助 cuDF,數(shù)據(jù)科學家現(xiàn)在可以在他們首選的代碼庫上全速運行數(shù)據(jù)處理。

NVIDIA RTX AI 硬件和技術(shù)也可以加速數(shù)據(jù)處理。這包括強大的 GPU,可提供在各個層面快速高效地加速 AI 所需的計算性能 — 從數(shù)據(jù)科學工作流到 PC 和工作站上的模型訓(xùn)練和定制。

數(shù)據(jù)科學的瓶頸

最常用的數(shù)據(jù)格式是按行和列組織的表格數(shù)據(jù)。小型數(shù)據(jù)集可以使用 Excel 等電子表格工具進行管理,但是,包含數(shù)千萬行的數(shù)據(jù)集和建模工作流通常依賴于采用了例如 Python 等編程語言的 DataFrame 程序庫。

Python 是進行數(shù)據(jù)分析時的熱門選擇,主要是因為 pandas 庫采用易于使用的應(yīng)用編程接口(API)。然而,隨著數(shù)據(jù)集的規(guī)模不斷增長,pandas 在純 CPU 系統(tǒng)中難以實現(xiàn)理想的處理速度和效率。該庫在處理文本密集型數(shù)據(jù)集時的性能也為人所詬病,而對大語言模型來說,這是一種重要的數(shù)據(jù)類型。

當數(shù)據(jù)需求超出 pandas 的能力時,數(shù)據(jù)科學家會面臨兩難境地:要么忍受緩慢的處理速度,要么采取復(fù)雜且成本高昂的措施,即轉(zhuǎn)而采用更高效但對用戶不夠友好的工具。

使用 RAPIDS cuDF加速預(yù)處理工作流

RAPIDS cuDF 配合 RTX AI PC 和工作站,可為熱門的 pandas 軟件庫提供最高達 100 倍加速

借助 RAPIDS cuDF,數(shù)據(jù)科學家現(xiàn)在可以在他們首選的代碼庫上全速運行數(shù)據(jù)處理。RAPIDS 是一套開源 GPU 加速的 Python 庫,旨在改進數(shù)據(jù)科學和分析工作流。cuDF 是一個 GPU DataFrame 庫,可提供類似于 pandas 的 API 來加載、過濾和操作數(shù)據(jù)。

使用 cuDF 的“pandas 加速器模式”,數(shù)據(jù)科學家可以在 GPU 上運行現(xiàn)有的 pandas 代碼,充分利用強大的并行處理功能,并可放心的將代碼在必要時移植到 CPU 上。這種互通性提供了出色、可靠的性能。

最新版本的 cuDF 支持更大規(guī)模的數(shù)據(jù)集和數(shù)十億行的表格文本數(shù)據(jù)。這樣,數(shù)據(jù)科學家就能夠使用 pandas 代碼來預(yù)處理生成式 AI 的數(shù)據(jù)。

在 NVIDIA RTX 加持的 AI 工作站

和 PC 上加速數(shù)據(jù)科學

最近的一項研究表明,57% 的數(shù)據(jù)科學家使用 PC、臺式機或工作站等本地資源來執(zhí)行數(shù)據(jù)科學任務(wù)。

從 NVIDIA GeForce RTX 4090 GPU 開始,數(shù)據(jù)科學家可以實現(xiàn)顯著的速度提升。隨著數(shù)據(jù)集規(guī)模不斷增長,處理工作占用更多內(nèi)存,相比于基于傳統(tǒng) CPU 的解決方案,在工作站中配合使用 cuDF 和 NVIDIA RTX 5880 Ada 架構(gòu) GPU,可以將性能提升多達 100 倍。

ea062c2c-9ffd-11ef-93f3-92fbcf53809c.png

y 軸表示兩種常見的數(shù)據(jù)科學操作—“join”和“groupby”,而 x 軸顯示運行每項操作所需的時間

數(shù)據(jù)科學家可以在 NVIDIA AI Workbench 上輕松開始使用 RAPIDS cuDF。利用這個基于容器的免費開發(fā)者環(huán)境管理器,數(shù)據(jù)科學家和開發(fā)者可以跨 GPU 系統(tǒng)創(chuàng)建、遷移 AI 和數(shù)據(jù)科學工作負載并進行協(xié)作。用戶可以從 NVIDIA GitHub 倉庫中提供的幾個示例項目開始,例如 cuDF AI Workbench 項目。

HP AI Studio 也默認支持 cuDF,這是一個集中式數(shù)據(jù)科學平臺,旨在幫助 AI 開發(fā)者將其開發(fā)環(huán)境從工作站無縫復(fù)制到云端。這便于他們創(chuàng)建、開發(fā)項目并進行協(xié)作,而無需管理多個環(huán)境。

在 RTX 加持的 AI PC 和工作站上,cuDF 的優(yōu)勢并不僅限于提升原始性能。還包括:

在強大的 GPU 上進行固定成本的本地開發(fā),并可以無縫復(fù)制到本地部署的服務(wù)器或云實例,從而節(jié)省時間和支出。

加快數(shù)據(jù)處理以實現(xiàn)更快迭代,以便數(shù)據(jù)科學家以交互式的速度進行實驗、優(yōu)化并從數(shù)據(jù)集中產(chǎn)生洞察。

實現(xiàn)更有效的數(shù)據(jù)處理,以在后續(xù)工作流獲得更好的模型結(jié)果。

數(shù)據(jù)科學的新時代

隨著 AI 和數(shù)據(jù)科學的不斷發(fā)展,快速處理和分析大量數(shù)據(jù)集的能力將成為各行業(yè)實現(xiàn)突破的關(guān)鍵差異化因素。無論是開發(fā)復(fù)雜的機器學習模型、執(zhí)行復(fù)雜的統(tǒng)計分析還是探索生成式 AI,RAPIDS cuDF 都可為新一代數(shù)據(jù)處理奠定基礎(chǔ)。

NVIDIA 正通過增加對最熱門的 DataFrame 工具的支持來鞏固這一基礎(chǔ),其中包括 Polars,它是增長最快的 Python 庫之一,與其他開箱即用的純 CPU 工具相比,可幫助顯著加速數(shù)據(jù)處理。

Polars 本月宣布推出由 RAPIDS cuDF 提供支持的 Polars GPU 引擎公開測試版。Polars 用戶現(xiàn)在可以將本已極快的 DataFrame 庫性能提升多達 13 倍。

RTX AI 為未來的工程師創(chuàng)造無限可能

無論在大學數(shù)據(jù)中心、GeForce RTX 筆記本電腦還是 NVIDIA RTX 工作站上運行,NVIDIA GPU 都可加速學習過程。數(shù)據(jù)科學領(lǐng)域及其他領(lǐng)域的學生將增強其學習體驗,并通過廣泛應(yīng)用于現(xiàn)實世界應(yīng)用的硬件獲得實戰(zhàn)經(jīng)驗。

生成式 AI 正在深入改變游戲、視頻會議和各種交互體驗。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5687

    瀏覽量

    110117
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41115

    瀏覽量

    302607
  • 工作流
    +關(guān)注

    關(guān)注

    0

    文章

    45

    瀏覽量

    12922

原文標題:解密 AI 如何加速數(shù)據(jù)科學工作流

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    扣子AI智能體工作流(完結(jié))

    https://www.bilibili.com/opus/1178756596191199237 扣子工作流:重新定義業(yè)務(wù)自動化,讓技術(shù)普惠照進現(xiàn)實 在數(shù)字化轉(zhuǎn)型的浪潮中,業(yè)務(wù)自動化始終是企業(yè)
    的頭像 發(fā)表于 04-25 11:21 ?286次閱讀

    工作流節(jié)點說明---工作流節(jié)點

    平臺提供工作流節(jié)點,實現(xiàn)工作流嵌套工作流的效果。 節(jié)點說明 在一個工作流中,開發(fā)者可以將另一個工作流作為其中的一個步驟或節(jié)點,實現(xiàn)復(fù)雜任務(wù)
    發(fā)表于 03-24 21:05

    工作流插件節(jié)點節(jié)點說明

    插件節(jié)點用于在工作流中調(diào)用插件運行指定工具。 插件是一系列工具的集合,每個工具都是一個可調(diào)用的API。插件廣場上架的插件或已上架的團隊插件支持以節(jié)點形式被集成到工作流中,拓展智能體的能力邊界
    發(fā)表于 03-23 16:54

    Oracle和NVIDIA合作加速向量搜索和企業(yè)數(shù)據(jù)處理

    Oracle 和 NVIDIA 正在與客戶合作,將 GPU 加速的向量索引構(gòu)建應(yīng)用于實際工作負載。Oracle Private AI Services Container 初期支持 CPU 執(zhí)行,現(xiàn)
    的頭像 發(fā)表于 03-23 15:26 ?431次閱讀

    NVIDIA發(fā)布面向媒體工作流的AI技術(shù)

    在 GTC 2026上,NVIDIA 宣布了多項強大的新技術(shù),旨在變革直播媒體和后期制作工作流。
    的頭像 發(fā)表于 03-23 15:15 ?449次閱讀

    NVIDIA cuDF和cuVS獲全球領(lǐng)先數(shù)據(jù)平臺采用

    企業(yè)每年產(chǎn)生數(shù)百 ZB (Zettabyte) 的數(shù)據(jù),并在爭相將這些信息轉(zhuǎn)化為洞察。NVIDIA cuDF 和 cuVS 作為基于 NVIDIA CUDA-X 構(gòu)建的加速數(shù)據(jù)庫,正在
    的頭像 發(fā)表于 03-19 15:46 ?456次閱讀

    Adobe和NVIDIA宣布達成戰(zhàn)略合作伙伴關(guān)系

    Adobe 和 NVIDIA 今日宣布建立戰(zhàn)略合作伙伴關(guān)系,以加速 AI 賦能的創(chuàng)作、生產(chǎn)和個性化,包括提供新一代基礎(chǔ) Adobe Firefly 模型和智能體工作流。
    的頭像 發(fā)表于 03-19 15:32 ?554次閱讀

    工作流大模型節(jié)點說明

    用與端側(cè)匹配版本的插件進行返回。 配置技能后,大模型節(jié)點的能力更接近一個獨立運行的智能體,可以自動進行意圖識別,并判斷調(diào)用技能的時機和方式,大幅度提高此節(jié)點的文本處理能力和文本生成效果,簡化工作流
    發(fā)表于 03-19 14:56

    工作流節(jié)點說明結(jié)束節(jié)點

    結(jié)束節(jié)點是工作流的最終節(jié)點,用于返回工作流運行后的結(jié)果。結(jié)束節(jié)點支持兩種返回方式:返回變量、返回文本。 返回變量 在返回變量模式下,工作流運行結(jié)束后會以JSON格式輸出所有返回參數(shù),適用于工作
    發(fā)表于 03-16 16:43

    工作流節(jié)點說明開始節(jié)點

    開始節(jié)點是工作流的起始節(jié)點,用于設(shè)定啟動工作流需要的輸入信息。開始節(jié)點只有輸入?yún)?shù),沒有輸出等其他參數(shù)。開始節(jié)點中默認有一個輸入?yún)?shù)USER_INPUT,一個默認的輸入?yún)?shù)FILES_INPUT(非
    發(fā)表于 03-13 14:52

    開發(fā)工作流創(chuàng)建工作流

    新建工作流 在小藝智能體平臺頁面,通過【工作空間】-【工作流】-【新建工作流】,進入新建工作流配置頁面。設(shè)置
    發(fā)表于 03-10 10:05

    利用NVIDIA Nemotron開放模型構(gòu)建智能文檔處理系統(tǒng)

    基于 NVIDIA Nemotron 開放模型的 AI 驅(qū)動文檔智能,增強科學研究、金融和法律等領(lǐng)域工作流。
    的頭像 發(fā)表于 02-25 11:21 ?679次閱讀

    生命科學領(lǐng)先企業(yè)采用 NVIDIA BioNeMo 平臺加速 AI 驅(qū)動的藥物研發(fā)

    —— NVIDIA 近日宣布對 NVIDIA BioNeMo? 進行重大擴展, 將通過一個開放式開發(fā)平臺支持實現(xiàn)實驗室閉環(huán)(lab-in-the-loop)工作流,以推動 AI 驅(qū)動的
    的頭像 發(fā)表于 01-14 11:40 ?661次閱讀
    生命科學領(lǐng)先企業(yè)采用 <b class='flag-5'>NVIDIA</b> BioNeMo 平臺<b class='flag-5'>加速</b> AI 驅(qū)動的藥物研發(fā)

    NVIDIA RAPIDS 25.06版本新增多項功能

    RAPIDS 是一套面向 Python 數(shù)據(jù)科學的 NVIDIA CUDA-X 庫,最新發(fā)布的 25.06 版本引入了多項亮眼新功能,其中包括 Polars GPU 執(zhí)行引擎——這是一種面向圖
    的頭像 發(fā)表于 09-09 09:54 ?1266次閱讀

    鋰電池制造 | 電芯預(yù)處理工藝的步驟詳解

    電芯預(yù)處理是鋰電池包制造的首要工序,無論是新能源汽車的續(xù)航穩(wěn)定性,還是儲能系統(tǒng)的循環(huán)壽命,其根基都可追溯至預(yù)處理工序?qū)﹄娦疽恢滦缘陌芽兀浜诵脑谟谕ㄟ^系統(tǒng)檢測與篩選消除量產(chǎn)電芯的性能差異,為后續(xù)組裝
    的頭像 發(fā)表于 08-11 14:53 ?2085次閱讀
    鋰電池制造 | 電芯<b class='flag-5'>預(yù)處理工</b>藝的步驟詳解