chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用Python算法預(yù)測客戶行為案例!

數(shù)據(jù)分析與開發(fā) ? 來源:CSDN ? 作者:ChangingWudake ? 2022-10-27 13:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

這是一份kaggle上的銀行的數(shù)據(jù)集,研究該數(shù)據(jù)集可以預(yù)測客戶是否認(rèn)購定期存款y。這里包含20個(gè)特征。

1. 分析框架

ab54dfda-55b5-11ed-a3b6-dac502259ad0.png

2. 數(shù)據(jù)讀取,數(shù)據(jù)清洗

#導(dǎo)入相關(guān)包
importnumpyasnp
importpandasaspd
#讀取數(shù)據(jù)
data=pd.read_csv('./1bank-additional-full.csv')
#查看表的行列數(shù)
data.shape

輸出:

ab69c184-55b5-11ed-a3b6-dac502259ad0.pngab7ee2a8-55b5-11ed-a3b6-dac502259ad0.png

這里只有nr.employed這列有丟失數(shù)據(jù),查看下:

data['nr.employed'].value_counts()
ab8febf2-55b5-11ed-a3b6-dac502259ad0.png

這里只有5191.0這個(gè)值,沒有其他的,且只有7763條數(shù)據(jù),這里直接將這列當(dāng)做異常值,直接將這列直接刪除了。

#data.drop('nr.employed',axis=1,inplace=True)

3. 探索性數(shù)據(jù)分析

3.1查看各年齡段的人數(shù)的分布

這里可以看出該銀行的主要用戶主要集中在23-60歲這個(gè)年齡層,其中29-39這個(gè)年齡段的人數(shù)相對(duì)其他年齡段多。

importmatplotlib.pyplotasplt
importseabornassns
plt.rcParams['font.sans-serif']='SimHei'
plt.figure(figsize=(20,8),dpi=256)
sns.countplot(x='age',data=data)
plt.title("各年齡段的人數(shù)")
aba1f54a-55b5-11ed-a3b6-dac502259ad0.png

3.2 其他特征的一些分布

plt.figure(figsize=(18,16),dpi=512)
plt.subplot(221)
sns.countplot(x='contact',data=data)
plt.title("contact分布情況")

plt.subplot(222)
sns.countplot(x='day_of_week',data=data)
plt.title("day_of_week分布情況")

plt.subplot(223)
sns.countplot(x='default',data=data)
plt.title("default分布情況")

plt.subplot(224)
sns.countplot(x='education',data=data)
plt.xticks(rotation=70)
plt.title("education分布情況")

plt.savefig('./1.png')
abaf93a8-55b5-11ed-a3b6-dac502259ad0.png
plt.figure(figsize=(18,16),dpi=512)
plt.subplot(221)
sns.countplot(x='housing',data=data)
plt.title("housing分布情況")

plt.subplot(222)
sns.countplot(x='job',data=data)
plt.xticks(rotation=70)
plt.title("job分布情況")

plt.subplot(223)
sns.countplot(x='loan',data=data)
plt.title("loan分布情況")

plt.subplot(224)
sns.countplot(x='marital',data=data)
plt.xticks(rotation=70)
plt.title("marital分布情況")

plt.savefig('./2.png')
ac1c1ffa-55b5-11ed-a3b6-dac502259ad0.png
plt.figure(figsize=(18,8),dpi=512)
plt.subplot(221)
sns.countplot(x='month',data=data)
plt.xticks(rotation=30)

plt.subplot(222)
sns.countplot(x='poutcome',data=data)
plt.xticks(rotation=30)
plt.savefig('./3.png')
ac34c794-55b5-11ed-a3b6-dac502259ad0.png

3.3 各特征的相關(guān)性

plt.figure(figsize=(10,8),dpi=256)
plt.rcParams['axes.unicode_minus']=False
sns.heatmap(data.corr(),annot=True)
plt.savefig('./4.png')
ac414b4a-55b5-11ed-a3b6-dac502259ad0.png

4. 特征規(guī)范化

4.1 將自變量的特征值轉(zhuǎn)換成標(biāo)簽類型

#特征化數(shù)據(jù)
fromsklearn.preprocessingimportLabelEncoder
features=['contact','day_of_week','default','education','housing',
'job','loan','marital','month','poutcome']

le_x=LabelEncoder()
forfeatureinfeatures:
data[feature]=le_x.fit_transform(data[feature])

4.2 將結(jié)果y值轉(zhuǎn)換成0、1

defparse_y(x):
if(x=='no'):
return0
else:
return1
data['y']=data['y'].apply(parse_y)
data['y']=data['y'].astype(int)

4.3 數(shù)據(jù)規(guī)范化

#數(shù)據(jù)規(guī)范化到正態(tài)分布的數(shù)據(jù)
#測試數(shù)據(jù)和訓(xùn)練數(shù)據(jù)的分割
fromsklearn.preprocessingimportStandardScaler
fromsklearn.model_selectionimporttrain_test_split
ss=StandardScaler()
train_x,test_x,train_y,test_y=train_test_split(data.iloc[:,:-1],
data['y'],
test_size=0.3)
train_x=ss.fit_transform(train_x)
test_x=ss.transform(test_x)

5. 模型訓(xùn)練

5.1 AdaBoost分類器

fromsklearn.ensembleimportAdaBoostClassifier
fromsklearn.metricsimportaccuracy_score
ada=AdaBoostClassifier()
ada.fit(train_x,train_y)
predict_y=ada.predict(test_x)
print("準(zhǔn)確率:",accuracy_score(test_y,predict_y))
ac766c58-55b5-11ed-a3b6-dac502259ad0.png

5.2 SVC分類器

fromsklearn.svmimportSVC
svc=SVC()
svc.fit(train_x,train_y)
predict_y=svc.predict(test_x)
print("準(zhǔn)確率:",accuracy_score(test_y,predict_y))
ac8cedf2-55b5-11ed-a3b6-dac502259ad0.png

5.3 K鄰近值分類器

fromsklearn.neighborsimportKNeighborsClassifier
knn=KNeighborsClassifier()
knn.fit(train_x,train_y)
predict_y=knn.predict(test_x)
print("準(zhǔn)確率:",accuracy_score(test_y,predict_y))
aca7deb4-55b5-11ed-a3b6-dac502259ad0.png

5.4 決策樹分類器

fromsklearn.treeimportDecisionTreeClassifier
dtc=DecisionTreeClassifier()
dtc.fit(train_x,train_y)
predict_y=dtc.predict(test_x)
print("準(zhǔn)確率:",accuracy_score(test_y,predict_y))
acbbf70a-55b5-11ed-a3b6-dac502259ad0.png

6 模型評(píng)價(jià)

6.1 AdaBoost分類器

fromsklearn.metricsimportroc_curve
fromsklearn.metricsimportauc
plt.figure(figsize=(8,6))
fpr1,tpr1,threshoulds1=roc_curve(test_y,ada.predict(test_x))
plt.stackplot(fpr1,tpr1,color='steelblue',alpha=0.5,edgecolor='black')
plt.plot(fpr1,tpr1,linewidth=2,color='black')
plt.plot([0,1],[0,1],ls='-',color='red')
plt.text(0.5,0.4,auc(fpr1,tpr1))
plt.title('AdaBoost分類器的ROC曲線')
acd2f4a0-55b5-11ed-a3b6-dac502259ad0.png

6.2 SVC分類器

plt.figure(figsize=(8,6))
fpr2,tpr2,threshoulds2=roc_curve(test_y,svc.predict(test_x))
plt.stackplot(fpr2,tpr2,alpha=0.5)
plt.plot(fpr2,tpr2,linewidth=2,color='black')
plt.plot([0,1],[0,1],ls='-',color='red')
plt.text(0.5,0.4,auc(fpr2,tpr2))
plt.title('SVD的ROC曲線')
ace52328-55b5-11ed-a3b6-dac502259ad0.png

6.3 K鄰近值分類器

plt.figure(figsize=(8,6))
fpr3,tpr3,threshoulds3=roc_curve(test_y,knn.predict(test_x))
plt.stackplot(fpr3,tpr3,alpha=0.5)
plt.plot(fpr3,tpr3,linewidth=2,color='black')
plt.plot([0,1],[0,1],ls='-',color='red')
plt.text(0.5,0.4,auc(fpr3,tpr3))
plt.title('K鄰近值的ROC曲線')
ad0006ac-55b5-11ed-a3b6-dac502259ad0.png

6.4 決策樹分類器

plt.figure(figsize=(8,6))
fpr4,tpr4,threshoulds4=roc_curve(test_y,dtc.predict(test_x))
plt.stackplot(fpr4,tpr4,alpha=0.5)
plt.plot(fpr4,tpr4,linewidth=2,color='black')
plt.plot([0,1],[0,1],ls='-',color='red')
plt.text(0.5,0.4,auc(fpr4,tpr4))
plt.title('決策樹的ROC曲線')
ad123c96-55b5-11ed-a3b6-dac502259ad0.png

審核編輯 :李倩


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4740

    瀏覽量

    96728
  • 數(shù)據(jù)分析
    +關(guān)注

    關(guān)注

    2

    文章

    1494

    瀏覽量

    35728
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4848

    瀏覽量

    88965

原文標(biāo)題:用 Python 算法預(yù)測客戶行為案例!

文章出處:【微信號(hào):DBDevs,微信公眾號(hào):數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Python modbus-tk如何獲得客戶端信息?

    Python modbus-tk如何獲得客戶端信息
    發(fā)表于 08-07 06:01

    工地AI行為識(shí)別系統(tǒng)作用

    工地AI行為識(shí)別系統(tǒng)作用 工地AI行為識(shí)別系統(tǒng)是什么? 工地AI行為識(shí)別系統(tǒng)是一種基于人工智能技術(shù)的智能監(jiān)控方案,通過攝像頭+AI算法,實(shí)時(shí)分析工地人員
    的頭像 發(fā)表于 05-08 12:00 ?559次閱讀

    景區(qū)AI行為識(shí)別系統(tǒng)作用

    景區(qū)AI行為識(shí)別系統(tǒng)作用 景區(qū)AI行為識(shí)別系統(tǒng)是什么? 景區(qū)AI行為識(shí)別系統(tǒng)是利用人工智能技術(shù)(如視頻分析、人臉識(shí)別)構(gòu)建的智能管理方案。通過部署攝像頭+AI算法,實(shí)時(shí)監(jiān)控游客
    的頭像 發(fā)表于 05-07 15:32 ?523次閱讀
    景區(qū)AI<b class='flag-5'>行為</b>識(shí)別系統(tǒng)作用

    工廠園區(qū)AI行為識(shí)別系統(tǒng)作用

    工廠園區(qū)AI行為識(shí)別系統(tǒng)作用 工廠園區(qū)AI行為識(shí)別系統(tǒng)是什么? 工廠園區(qū)AI行為識(shí)別系統(tǒng)是基于人工智能技術(shù)的智能化管理方案,通過攝像頭與AI算法融合,實(shí)時(shí)監(jiān)控人員
    的頭像 發(fā)表于 05-06 17:49 ?429次閱讀

    采用可更新且具區(qū)分度錨點(diǎn)的多模態(tài)運(yùn)動(dòng)預(yù)測研究

    在自動(dòng)駕駛領(lǐng)域,運(yùn)動(dòng)預(yù)測 (Motion Prediction) 是一個(gè)重要任務(wù),它有助于場景理解和安全決策。該任務(wù)利用歷史狀態(tài)和道路地圖來預(yù)測目標(biāo)智能體的未來軌跡。其主要挑戰(zhàn)來自未來行為的多模態(tài)性 (Multimodality
    的頭像 發(fā)表于 04-01 10:32 ?501次閱讀
    采用可更新且具區(qū)分度錨點(diǎn)的多模態(tài)運(yùn)動(dòng)<b class='flag-5'>預(yù)測</b>研究

    DLP6500能否Python編程進(jìn)行開發(fā),是否有API接口?

    本人第一次接觸DLP的開發(fā)板,想知道DLP6500這款板子能否Python編程進(jìn)行開發(fā),是否有API接口?
    發(fā)表于 02-28 06:58

    設(shè)備管理系統(tǒng):如何實(shí)現(xiàn)預(yù)測性維護(hù)與故障預(yù)防?

    設(shè)備管理系統(tǒng)通過數(shù)據(jù)收集與分析、智能算法和維護(hù)策略制定,實(shí)現(xiàn)預(yù)測性維護(hù)與故障預(yù)防。通過建立設(shè)備模型,預(yù)測設(shè)備性能變化趨勢(shì)。設(shè)定預(yù)警閾值,確定關(guān)鍵指標(biāo)。通過數(shù)據(jù)分析,發(fā)現(xiàn)設(shè)備潛在故障模式和異常
    的頭像 發(fā)表于 02-13 09:56 ?948次閱讀
    設(shè)備管理系統(tǒng):如何實(shí)現(xiàn)<b class='flag-5'>預(yù)測</b>性維護(hù)與故障預(yù)防?

    使用Python實(shí)現(xiàn)xgboost教程

    使用Python實(shí)現(xiàn)XGBoost模型通常涉及以下幾個(gè)步驟:數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練、模型評(píng)估和模型預(yù)測。以下是一個(gè)詳細(xì)的教程,指導(dǎo)你如何在Python中使用XGBoost。 1. 安裝XGBoost
    的頭像 發(fā)表于 01-19 11:21 ?1972次閱讀

    基于梯度下降算法的三元鋰電池循環(huán)壽命預(yù)測

    不同比例、范圍的訓(xùn)練集與測試集劃分?;跈C(jī)器學(xué)習(xí)的梯度下降算法對(duì)訓(xùn)練集進(jìn)行模型訓(xùn)練,以迭代后的權(quán)重值、偏置值進(jìn)行結(jié)果預(yù)測并與試驗(yàn)數(shù)據(jù)進(jìn)行對(duì)比。結(jié)果表明:適宜參數(shù)下的梯度下降算法可以應(yīng)用于鋰離子電池循環(huán)壽命的
    的頭像 發(fā)表于 01-16 10:19 ?654次閱讀
    基于梯度下降<b class='flag-5'>算法</b>的三元鋰電池循環(huán)壽命<b class='flag-5'>預(yù)測</b>

    臺(tái)灣COMCHIP高端MOS:車客戶導(dǎo)入案例型號(hào)推薦 下

    深圳鴻合智遠(yuǎn)|臺(tái)灣COMCHIP高端MOS:車客戶導(dǎo)入案例型號(hào)推薦 下
    的頭像 發(fā)表于 12-11 11:00 ?651次閱讀
    臺(tái)灣COMCHIP高端MOS:車<b class='flag-5'>用</b><b class='flag-5'>客戶</b>導(dǎo)入案例型號(hào)推薦 下

    臺(tái)灣COMCHIP高端MOS:車客戶導(dǎo)入案例型號(hào)推薦 中

    深圳鴻合智遠(yuǎn)|臺(tái)灣COMCHIP高端MOS:車客戶導(dǎo)入案例型號(hào)推薦 中
    的頭像 發(fā)表于 12-10 10:59 ?691次閱讀
    臺(tái)灣COMCHIP高端MOS:車<b class='flag-5'>用</b><b class='flag-5'>客戶</b>導(dǎo)入案例型號(hào)推薦 中

    AI行為識(shí)別攝像機(jī)

    攝像機(jī)是一種利用深度學(xué)習(xí)算法和計(jì)算機(jī)視覺技術(shù),對(duì)視頻圖像進(jìn)行實(shí)時(shí)分析的智能設(shè)備。它能夠自動(dòng)識(shí)別并分析人類的各種行為,如抽煙、打斗、跌倒等,并根據(jù)設(shè)定的規(guī)則做出相應(yīng)反應(yīng)
    的頭像 發(fā)表于 11-21 10:49 ?965次閱讀
    AI<b class='flag-5'>行為</b>識(shí)別攝像機(jī)

    如何使用Python實(shí)現(xiàn)PID控制

    PID控制(比例-積分-微分控制)是一種常見的反饋控制算法,廣泛應(yīng)用于工業(yè)控制系統(tǒng)中。在Python中實(shí)現(xiàn)PID控制,我們可以遵循以下步驟: 1. 理解PID控制原理 PID控制器有三個(gè)主要參數(shù)
    的頭像 發(fā)表于 11-14 09:09 ?1947次閱讀

    如何使用Python構(gòu)建LSTM神經(jīng)網(wǎng)絡(luò)模型

    構(gòu)建一個(gè)LSTM(長短期記憶)神經(jīng)網(wǎng)絡(luò)模型是一個(gè)涉及多個(gè)步驟的過程。以下是使用Python和Keras庫構(gòu)建LSTM模型的指南。 1. 安裝必要的庫 首先,確保你已經(jīng)安裝了Python和以下庫
    的頭像 發(fā)表于 11-13 10:10 ?1976次閱讀

    Python中代理服務(wù)器的配置與應(yīng)用

    在網(wǎng)絡(luò)通信中,代理服務(wù)器作為一種重要的網(wǎng)絡(luò)中間件,充當(dāng)著客戶端和目標(biāo)服務(wù)器之間的中間人角色。它能夠接收來自客戶端的請(qǐng)求,并將這些請(qǐng)求轉(zhuǎn)發(fā)給目標(biāo)服務(wù)器,然后將服務(wù)器的響應(yīng)返回給客戶端。Pytho
    的頭像 發(fā)表于 11-12 07:13 ?768次閱讀