chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Python工具pandas篩選數(shù)據(jù)的15個(gè)常用技巧

數(shù)據(jù)分析與開(kāi)發(fā) ? 來(lái)源:數(shù)據(jù)分析與開(kāi)發(fā) ? 作者:數(shù)據(jù)分析與開(kāi)發(fā) ? 2021-03-30 10:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

pandas是Python數(shù)據(jù)分析必備工具,它有強(qiáng)大的數(shù)據(jù)清洗能力,往往能用非常少的代碼實(shí)現(xiàn)較復(fù)雜的數(shù)據(jù)處理

今天,總結(jié)了pandas篩選數(shù)據(jù)的15個(gè)常用技巧,主要包括5個(gè)知識(shí)點(diǎn):

比較運(yùn)算:==、《、》、》=、《=、!=

范圍運(yùn)算:between(left,right)

字符篩選:str.contains(pattern或字符串,na=False)

邏輯運(yùn)算:&(與)、|(或)、not(取反)

比較函數(shù):eq, ne, le, lt, ge, gt(相當(dāng)于==,=!,《=,《,》=,》)

apply和isin函數(shù)

”下面以超市運(yùn)營(yíng)數(shù)據(jù)為例,給大家逐個(gè)講解首先讀取數(shù)據(jù):

import pandas as pd

data=pd.read_excel(‘超市運(yùn)營(yíng)數(shù)據(jù)模板.xlsx’)

data

8820b96c-8e33-11eb-8b86-12bb97331649.png

先看一下各列的數(shù)據(jù)類(lèi)型:

data.dtypes

商品ID int64

類(lèi)別ID int64

門(mén)店編號(hào) object

單價(jià) float64

銷(xiāo)量 float64

訂單ID object

日期 datetime64[ns]

時(shí)間 object

dtype: object

下面以實(shí)際應(yīng)用場(chǎng)景為例開(kāi)始講解:

1.篩選門(mén)店編號(hào)為‘CDXL’的運(yùn)營(yíng)數(shù)據(jù)①第一種方法,用比較運(yùn)算符‘==’:

data[data.門(mén)店編號(hào)==‘CDXL’]

8bb1a37a-8e33-11eb-8b86-12bb97331649.png

②第二種方法,用比較函數(shù)‘eq’:

data[data[‘門(mén)店編號(hào)’].eq(‘CDXL’)]

8d57158e-8e33-11eb-8b86-12bb97331649.png

2.篩選單價(jià)小于等于10元的運(yùn)營(yíng)數(shù)據(jù)③第一種方法,用比較運(yùn)算符‘《=’:

data[data.單價(jià)《=10]

90a6426e-8e33-11eb-8b86-12bb97331649.png

④第二種方法,用比較函數(shù)‘le’:

data[data[‘單價(jià)’].le(10)]

928adb4e-8e33-11eb-8b86-12bb97331649.png

3.篩選銷(xiāo)量大于2000的運(yùn)營(yíng)數(shù)據(jù)⑤第一種方法,用比較運(yùn)算符‘》=’:

data[data.銷(xiāo)量》2]

92f569a0-8e33-11eb-8b86-12bb97331649.png

⑥第二種方法,用比較函數(shù)‘ge’:

data[data[‘銷(xiāo)量’].ge(2)]

92f569a0-8e33-11eb-8b86-12bb97331649.png

4.篩選除門(mén)店‘CDXL’外的運(yùn)營(yíng)數(shù)據(jù)⑦第一種方法,用比較運(yùn)算符‘!=’:

data[data.門(mén)店編號(hào)!=‘CDXL’]

9345c238-8e33-11eb-8b86-12bb97331649.png

⑧第二種方法,用比較函數(shù)‘ne’:

data[data[‘門(mén)店編號(hào)’].ne(‘CDXL’)]

9397ac38-8e33-11eb-8b86-12bb97331649.png

5.篩選2020年5月的運(yùn)營(yíng)數(shù)據(jù)首先將日期格式化:

data[‘日期’]=data[“日期”].values.astype(‘datetime64’) #如果已為日期格式則此步驟可省略

data[‘日期’]

import datetime

s_date = datetime.datetime.strptime(‘2020-04-30’, ‘%Y-%m-%d’).date() #起始日期

e_date = datetime.datetime.strptime(‘2020-06-01’, ‘%Y-%m-%d’).date() #結(jié)束日期

⑨第一種方法,用邏輯運(yùn)算符號(hào)‘》’ ‘《’和‘&’:

Pandasdatetime64[ns]不能直接與datetime.date相比,需要用pd.Timestamp進(jìn)行轉(zhuǎn)化

data[(data.日期》pd.Timestamp(s_date))&(data.日期《pd.Timestamp(e_date))]

93dc75ca-8e33-11eb-8b86-12bb97331649.png

⑩第二種,用比較函數(shù)‘gt’‘lt’和‘&’:

data[(data[‘日期’].lt(pd.Timestamp(e_date)))&(data[‘日期’].gt(pd.Timestamp(s_date)))]

94be8c4e-8e33-11eb-8b86-12bb97331649.png

?第三種,用apply函數(shù)實(shí)現(xiàn):

id_a=data.日期.apply(lambda x: x.year ==2020 and x.month==5)

data[id_a]

950240e2-8e33-11eb-8b86-12bb97331649.png

?第四種,用between函數(shù)實(shí)現(xiàn):

id_b=data.日期.between(pd.Timestamp(s_date),pd.Timestamp(e_date))

data[id_b]

953ad6f0-8e33-11eb-8b86-12bb97331649.png

6.篩選“類(lèi)別ID”包含‘000’的數(shù)據(jù)?第一種,用contains函數(shù):

data[‘類(lèi)別ID’]=data[‘類(lèi)別ID’].values.astype(‘str’) #將該列轉(zhuǎn)換為字符數(shù)據(jù)類(lèi)型

id_c=data.類(lèi)別ID.str.contains(‘000’,na=False)

data[id_c]

95c1ec76-8e33-11eb-8b86-12bb97331649.png

?第二種,用isin函數(shù):

id_i=data.類(lèi)別ID.isin([‘000’]) #接受一個(gè)列表

data[id_i]

很遺憾,isin函數(shù)搞不定,因?yàn)樗荒芘袛嘣摿兄性厥欠裨诹斜碇?/p>

7.篩選商品ID以“301”開(kāi)頭的運(yùn)營(yíng)數(shù)據(jù)?需要用contains函數(shù)結(jié)合正則表達(dá)式使用:

data[‘商品ID’]=data[‘商品ID’].values.astype(‘str’) #將該列轉(zhuǎn)換為字符數(shù)據(jù)類(lèi)型

id_c2=data.商品ID.str.contains(‘301d{5}’,na=False)

data[id_c2]

95c1ec76-8e33-11eb-8b86-12bb97331649.png

為了方便大家學(xué)習(xí),我已經(jīng)將本文數(shù)據(jù)及代碼打包好,請(qǐng)關(guān)注 數(shù)據(jù)分析與開(kāi)發(fā) 公眾號(hào)在后臺(tái)回復(fù)關(guān)鍵字:篩選數(shù)據(jù) 獲取。

原文標(biāo)題:一次性總結(jié)了pandas提取數(shù)據(jù)的15種方法,統(tǒng)統(tǒng)只需1行代碼!

文章出處:【微信公眾號(hào):數(shù)據(jù)分析與開(kāi)發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)分析
    +關(guān)注

    關(guān)注

    2

    文章

    1472

    瀏覽量

    35018
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4827

    瀏覽量

    86678

原文標(biāo)題:一次性總結(jié)了pandas提取數(shù)據(jù)的15種方法,統(tǒng)統(tǒng)只需1行代碼!

文章出處:【微信號(hào):DBDevs,微信公眾號(hào):數(shù)據(jù)分析與開(kāi)發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    python入門(mén)圣經(jīng)-高清電子書(shū)(建議下載)

    和Pygal 等強(qiáng)大的Python 庫(kù)和工具介紹,以及列表、字典、if 語(yǔ)句、類(lèi)、文件與異常、代碼測(cè)試等內(nèi)容; 第二部分將理論付諸實(shí)踐,講解如何開(kāi)發(fā)三個(gè)項(xiàng)目,包括簡(jiǎn)單的Python
    發(fā)表于 04-10 16:53

    OSS Nokalva:適用于Python的OSS NAS工具

    執(zhí)行以下任務(wù):編寫(xiě)軟件來(lái)創(chuàng)建、處理、調(diào)試和測(cè)試 NAS 消息。在處理 3GPP 版本中的更改時(shí),此任務(wù)特別耗時(shí)且容易出錯(cuò)?,F(xiàn)在客戶(hù)可以專(zhuān)注于他們的核心業(yè)務(wù)。 用于 Python 的 OSS NAS 工具
    的頭像 發(fā)表于 02-09 09:16 ?450次閱讀
    OSS Nokalva:適用于<b class='flag-5'>Python</b>的OSS NAS<b class='flag-5'>工具</b>

    適用于MySQL和MariaDB的Python連接器:可靠的MySQL數(shù)據(jù)連接器和數(shù)據(jù)庫(kù)

    和 MariaDB 數(shù)據(jù)庫(kù)服務(wù)器以及托管數(shù)據(jù)庫(kù)服務(wù),以對(duì)存儲(chǔ)的數(shù)據(jù)執(zhí)行創(chuàng)建、讀取、更新和刪除操作。該解決方案完全實(shí)現(xiàn)了 Python DB API 2.0 規(guī)范,并作為 Window
    的頭像 發(fā)表于 01-17 12:18 ?486次閱讀
    適用于MySQL和MariaDB的<b class='flag-5'>Python</b>連接器:可靠的MySQL<b class='flag-5'>數(shù)據(jù)</b>連接器和<b class='flag-5'>數(shù)據(jù)</b>庫(kù)

    如何進(jìn)行元器件篩選?

    電子元件的核心作用在電子設(shè)備中,電子元件扮演著基礎(chǔ)而關(guān)鍵的角色,它們是電子通信、數(shù)據(jù)處理和自動(dòng)化控制等技術(shù)領(lǐng)域的基石。篩選的必要性為了確保電子元件在其整個(gè)使用壽命內(nèi)都能穩(wěn)定工作,避免因元件本身的缺陷
    的頭像 發(fā)表于 12-19 12:37 ?928次閱讀
    如何進(jìn)行元器件<b class='flag-5'>篩選</b>?

    Kaggle知識(shí)點(diǎn):使用大模型進(jìn)行特征篩選

    數(shù)據(jù)科學(xué)數(shù)據(jù)挖掘的核心是是對(duì)海量數(shù)據(jù)進(jìn)行有效的篩選和分析。傳統(tǒng)上數(shù)據(jù)篩選依賴(lài)于
    的頭像 發(fā)表于 12-03 01:06 ?1716次閱讀
    Kaggle知識(shí)點(diǎn):使用大模型進(jìn)行特征<b class='flag-5'>篩選</b>

    使用Python進(jìn)行串口通信的案例

    當(dāng)然!以下是一個(gè)使用Python進(jìn)行串口通信的簡(jiǎn)單示例。這個(gè)示例展示了如何配置串口、發(fā)送數(shù)據(jù)以及接收數(shù)據(jù)。我們將使用 pyserial 庫(kù),這是一個(gè)
    的頭像 發(fā)表于 11-22 09:11 ?1455次閱讀

    RAPIDS cuDF將pandas提速近150倍

    在 NVIDIA GTC 2024 上,NVIDIA 宣布,RAPIDS cuDF 當(dāng)前已能夠?yàn)?950 萬(wàn) pandas 用戶(hù)帶來(lái) GPU 加速,且無(wú)需修改代碼。
    的頭像 發(fā)表于 11-20 09:52 ?653次閱讀
    RAPIDS cuDF將<b class='flag-5'>pandas</b>提速近150倍

    如何使用Python構(gòu)建LSTM神經(jīng)網(wǎng)絡(luò)模型

    numpy tensorflow 2. 準(zhǔn)備數(shù)據(jù) LSTM模型通常用于序列數(shù)據(jù),比如時(shí)間序列預(yù)測(cè)或文本生成。這里我們以一個(gè)簡(jiǎn)單的時(shí)間序列預(yù)測(cè)為例。假
    的頭像 發(fā)表于 11-13 10:10 ?1560次閱讀

    Kali Linux常用工具介紹

    Kali Linux 虛擬機(jī)中自帶了大量滲透測(cè)試工具,涵蓋了信息收集、漏洞利用、口令破解、漏洞掃描等多個(gè)方面。 以下是按分類(lèi)簡(jiǎn)要介紹一部分常用工具的使用方法: 使用方法只能當(dāng)做參考,**詳細(xì)
    的頭像 發(fā)表于 11-11 09:29 ?1589次閱讀

    Python常用函數(shù)大全

    Python 世界里,有一些寶藏函數(shù)和模塊,它們可以讓你編程更輕松、代碼更高效。這篇文章將帶你一一認(rèn)識(shí)這些神器,讓你的開(kāi)發(fā)生活瞬間輕松不少!
    的頭像 發(fā)表于 10-27 17:20 ?904次閱讀

    常用的devops工具集成方法

    常用的devops工具集成方法涵蓋了軟件開(kāi)發(fā)和運(yùn)維的各個(gè)方面,從版本控制到自動(dòng)化構(gòu)建、測(cè)試、部署和監(jiān)控。這些工具的有效集成可以幫助團(tuán)隊(duì)提高協(xié)作效率,減少溝通障礙,實(shí)現(xiàn)快速、高質(zhì)量的軟件交付。
    的頭像 發(fā)表于 10-09 11:21 ?530次閱讀

    使用Python進(jìn)行Ping測(cè)試

    在網(wǎng)絡(luò)工程中,Ping測(cè)試是一種常用的網(wǎng)絡(luò)診斷工具,用于檢查網(wǎng)絡(luò)連接的可達(dá)性和響應(yīng)時(shí)間。Ping測(cè)試通過(guò)向目標(biāo)主機(jī)發(fā)送ICMP(Internet Control Message Protocol
    的頭像 發(fā)表于 08-12 17:56 ?1002次閱讀
    使用<b class='flag-5'>Python</b>進(jìn)行Ping測(cè)試

    pytorch和python的關(guān)系是什么

    在當(dāng)今的人工智能領(lǐng)域,Python已經(jīng)成為了最受歡迎的編程語(yǔ)言之一。Python的易學(xué)易用、豐富的庫(kù)和框架以及強(qiáng)大的社區(qū)支持,使其成為了數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等領(lǐng)域的首選語(yǔ)言。而在深度學(xué)習(xí)領(lǐng)域
    的頭像 發(fā)表于 08-01 15:27 ?3265次閱讀

    Python建模算法與應(yīng)用

    Python作為一種功能強(qiáng)大、免費(fèi)、開(kāi)源且面向?qū)ο蟮木幊陶Z(yǔ)言,在科學(xué)計(jì)算、數(shù)學(xué)建模、數(shù)據(jù)分析等領(lǐng)域展現(xiàn)出了卓越的性能。其簡(jiǎn)潔的語(yǔ)法、對(duì)動(dòng)態(tài)輸入的支持以及解釋性語(yǔ)言的本質(zhì),使得Python在多個(gè)平臺(tái)
    的頭像 發(fā)表于 07-24 10:41 ?1246次閱讀

    opencv-python和opencv一樣嗎

    不一樣。OpenCV(Open Source Computer Vision Library)是一個(gè)開(kāi)源的計(jì)算機(jī)視覺(jué)和機(jī)器學(xué)習(xí)軟件庫(kù),它提供了大量的圖像和視頻處理功能。OpenCV-Python
    的頭像 發(fā)表于 07-16 10:38 ?2075次閱讀