chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

10個超級實用的數(shù)據(jù)可視化圖表

數(shù)據(jù)分析與開發(fā) ? 來源:愛數(shù)據(jù)LoveData ? 2023-01-12 10:04 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

可視化是一種方便的觀察數(shù)據(jù)的方式,可以一目了然地了解數(shù)據(jù)塊。我們經(jīng)常使用柱狀圖、直方圖、餅圖、箱圖、熱圖、散點圖、線狀圖等。這些典型的圖對于數(shù)據(jù)可視化是必不可少的。除了這些被廣泛使用的圖表外,還有許多很好的卻很少被使用的可視化方法,這些圖有助于完成我們的工作,下面我們看看有那些圖可以進(jìn)行。

1、平行坐標(biāo)圖

Parallel Coordinate

我們最多可以可視化 3 維數(shù)據(jù)。但是我們有時需要可視化超過3維的數(shù)據(jù)才能獲得更多的信息。我們經(jīng)常使用PCAt-SNE來降維并繪制它。在降維的情況下,可能會丟失大量信息。在某些情況下,我們需要考慮所有特征,平行坐標(biāo)圖有助于做到這一點。

3ef562aa-9198-11ed-bfe3-dac502259ad0.png

鳶尾花數(shù)據(jù)集的平行坐標(biāo)圖

上面的圖片。橫線(平行軸)表示鳶尾花的特征(花瓣長、萼片長、萼片寬、花瓣寬)。分類是Setosa, Versicolor和Virginica。上圖將該物種編碼為Setosa→1,Versicolor→2,Virginica→3。每個平行軸包含最小值到最大值(例如,花瓣長度從1到6.9,萼片長度從4.3到7.9,等等)。例如,考慮花瓣長度軸。這表明與其他兩種植物相比,瀨蝶屬植物的花瓣長度較小,其中維珍屬植物的花瓣長度最高。

有了這個圖,我們可以很容易地獲得數(shù)據(jù)集的總體信息。數(shù)據(jù)集是什么樣子的?讓我們來看看。

3f2362d6-9198-11ed-bfe3-dac502259ad0.png

讓我們用Plotly Express庫[1]可視化數(shù)據(jù)。Plotly庫提供了一個交互式繪圖工具。


		

importplotly.expressaspx df=px.data.iris() fig=px.parallel_coordinates(df,color="species_id",labels={"species_id":"Species", "sepal_width":"SepalWidth","sepal_length":"SepalLength", "petal_width":"PetalWidth","petal_length":"PetalLength",}, color_continuous_scale=px.colors.diverging.Tealrose, color_continuous_midpoint=2) fig.show()

output

3f31f2c4-9198-11ed-bfe3-dac502259ad0.png

除了上圖以外我們還可以使用其他庫,如pandasscikit-learnmatplotlib來繪制并行坐標(biāo)。

2、六邊形分箱圖

Hexagonal Binning

六邊形分箱圖是一種用六邊形直觀表示二維數(shù)值數(shù)據(jù)點密度的方法。


		

ax=df.plot.hexbin(x='sepal_width',y='sepal_length', gridsize=20,color='#BDE320')

output

3f42d008-9198-11ed-bfe3-dac502259ad0.png

Pandas允許我們繪制六邊形binning [2]。我已經(jīng)展示了用于查找sepal_widthsepal_length列的密度的圖。

如果仔細(xì)觀察圖表,我們會發(fā)現(xiàn)總面積被分成了無數(shù)個六邊形。每個六邊形覆蓋特定區(qū)域。我們注意到六邊形有顏色變化。六邊形有的沒有顏色,有的是淡綠色,有的顏色很深。根據(jù)圖右側(cè)顯示的色標(biāo),顏色密度隨密度變化。比例表示具有顏色變化的數(shù)據(jù)點的數(shù)量。六邊形沒有填充顏色,這意味著該區(qū)域沒有數(shù)據(jù)點。

其他庫,如matplotlibseaborn、bokeh(交互式繪圖)也可用于繪制它。

3、等高線密度圖

Countour

二維等高線密度圖是可視化特定區(qū)域內(nèi)數(shù)據(jù)點密度的另一種方法。這是為了找到兩個數(shù)值變量的密度。例如,下面的圖顯示了在每個陰影區(qū)域有多少數(shù)據(jù)點。


		

importplotly.expressaspx fig=px.density_contour(df,x="sepal_width",y="sepal_length") fig.update_traces(contours_coloring="fill",contours_showlabels=True) fig.show()

output

3f534f82-9198-11ed-bfe3-dac502259ad0.png

為了生成上面的圖表,我這里使用了plotly庫,因為它可以方便地繪制交互式的圖表。我們這里繪制了兩個變量sepal_widthsepal_length的密度。 當(dāng)然,也可以使用其他庫,如seabornmatplotlib等。

4、QQ-plot

QQ plot是另一個有趣的圖。QQQuantile - Quantile plot的縮寫(Quantile/percentile是一個范圍,在這個范圍內(nèi)數(shù)據(jù)下降了指定百分比。例如,第10個quantile/percentile表示在該范圍下,找到了10%的數(shù)據(jù),90% 超出范圍)。這是一種直觀地檢查數(shù)值變量是否服從正態(tài)分布的方法。讓我解釋一下它是如何工作的。

3f617936-9198-11ed-bfe3-dac502259ad0.png

(a)樣本分布(b)標(biāo)準(zhǔn)正態(tài)分布

圖(a)是樣本分布;(b)是標(biāo)準(zhǔn)正態(tài)分布。對于樣本分布,數(shù)據(jù)范圍從10到100(100% 數(shù)據(jù)在 10 到 100 之間)。但對于標(biāo)準(zhǔn)正態(tài)分布,100%的數(shù)據(jù)在-3 到3(z 分?jǐn)?shù))的范圍內(nèi)。在QQ圖中,兩個x軸值均分為 100個相等的部分(稱為分位數(shù))。如果我們針對x和y軸繪制這兩個值,我們將得到一個散點圖。

3f70a9b0-9198-11ed-bfe3-dac502259ad0.png

QQ-plot

散點圖位于對角線上。這意味著樣本分布是正態(tài)分布。如果散點圖位于左邊或右邊而不是對角線,這意味著樣本不是正態(tài)分布的。

導(dǎo)入必要的庫


		

importpandasaspd importnumpyasnp importmatplotlib.pyplotasplt importseabornassns

生成正態(tài)分布數(shù)據(jù)。


		

np.random.seed(10) #GenerateUnivariateObservations gauss_data=5*np.random.randn(100)+50

繪制數(shù)據(jù)點的分布。

sns.histplot(data=gauss_data,kde=True)

output

3f7fa8f2-9198-11ed-bfe3-dac502259ad0.png

該圖顯示數(shù)據(jù)是正態(tài)分布的。我們用數(shù)據(jù)點做qq-plot來檢驗它是否正態(tài)分布。


		

importstatsmodels.apiassm #q-qplot sm.qqplot(gauss_data,line='s') plt.show()

output

3f8b07c4-9198-11ed-bfe3-dac502259ad0.png

該圖顯示散點位于對角線上。所以它是正態(tài)分布的。

小提琴圖

Violin Plot

小提琴圖與箱線圖相關(guān)。我們能從小提琴圖中獲得的另一個信息是密度分布。簡單來說就是一個結(jié)合了密度分布的箱線圖。我們將其與箱線圖進(jìn)行比較。 在小提琴圖中,小提琴中間的白點表示中點。實心框表示四分位數(shù)間距 (IQR)。上下相鄰值是異常值的圍欄。超出范圍,一切都是異常值。下圖顯示了比較。

3f99d83a-9198-11ed-bfe3-dac502259ad0.png

盒狀圖和小提琴狀圖的常見組成。所有學(xué)術(shù)級別的薪酬總額

讓我們看看小提琴圖的可視化。


		

importseabornassns sns.violinplot(data=df,y="sepal_width")

output

3fab5380-9198-11ed-bfe3-dac502259ad0.png

我們還可以通過傳遞名稱來繪制不同物種的小提琴圖。


		

importseabornassns sns.violinplot(data=df,x='species',y="sepal_width")

output

3fc285d2-9198-11ed-bfe3-dac502259ad0.png

還可以使用其他庫,如plotly、matplotlib等來繪制小提琴圖。

箱線圖的改進(jìn)版

Boxen plot

Boxenplotseaborn庫引入的一種新型箱線圖。對于箱線圖,框是在四分位數(shù)上創(chuàng)建的。但在Boxenplot中,數(shù)據(jù)被分成更多的分位數(shù)。它提供了對數(shù)據(jù)的更多內(nèi)存。

鳶尾花數(shù)據(jù)集的Boxenplot顯示了sepal_width的數(shù)據(jù)分布。

sns.boxenplot(x=df["sepal_width"])

output

3fed6702-9198-11ed-bfe3-dac502259ad0.png

上圖顯示了比箱線圖更多的盒。這是因為每個框代表一個特定的分位數(shù)。

sns.boxenplot(data=df,x="species",y='sepal_width')

output

3ffac2d0-9198-11ed-bfe3-dac502259ad0.png

不同物種sepal_widthBoxenplot圖。

點圖

下圖中有一些名為誤差線的垂直線和其他一些連接這些垂直線的線。讓我們看看它的確切含義。

40092686-9198-11ed-bfe3-dac502259ad0.png

點圖是一種通過上圖中顯示的點的位置來表示數(shù)值變量集中趨勢的方法,誤差條表示變量的不確定性(置信區(qū)間)[4]。繪制線圖是為了比較不同分類值的數(shù)值變量的變異性 [4]。

讓我們舉一個實際的例子—-我們繼續(xù)使用seaborn庫和iris數(shù)據(jù)集(在平行坐標(biāo)部分中提到)。


		
			importseabornassns sns.pointplot(data=df,x="species",y="sepal_width")

output

402829e6-9198-11ed-bfe3-dac502259ad0.png

分簇散點圖

Swarm plot

Swarm plot是另一個受“beeswarm”啟發(fā)的有趣圖表。通過此圖我們可以輕松了解不同的分類值如何沿數(shù)值軸分布[5]。它在不重疊數(shù)據(jù)點的情況下繪制數(shù)據(jù)。但它不適用于大型數(shù)據(jù)集。


		

importseabornassns sns.swarmplot(data=df,x="species",y="sepal_width")

output

4036d66c-9198-11ed-bfe3-dac502259ad0.png

旭日圖

Sunburst Chart

它是圓環(huán)圖或餅圖的定制版本,將一些額外的層次信息集成到圖中 [7]。

4041d4ae-9198-11ed-bfe3-dac502259ad0.png

Sunburst Chart

整個圖表被分成幾個環(huán)(從內(nèi)到外)。它保存層次結(jié)構(gòu)信息,其中內(nèi)環(huán)位于層次結(jié)構(gòu)的頂部,外環(huán)位于較低的[7]階。

404fb330-9198-11ed-bfe3-dac502259ad0.png


		

importplotly.expressaspx df=px.data.tips()

output

405f854e-9198-11ed-bfe3-dac502259ad0.png

繪制旭日圖


		

fig=px.sunburst(df,path=['sex','day','time'], values='total_bill',color='time') fig.show()

output

406b3bc8-9198-11ed-bfe3-dac502259ad0.png

sunburst類的path屬性提供了層次結(jié)構(gòu),其中性別位于層次結(jié)構(gòu)的頂部,然后是日期和時間。

詞云

Word Cloud

詞云圖的想法非常簡單。假設(shè)我們有一組文本文檔。單詞有很多,有些是經(jīng)常出現(xiàn)的,有些是很少出現(xiàn)的。在詞云圖中,所有單詞都被繪制在特定的區(qū)域中,頻繁出現(xiàn)的單詞被高亮顯示(用較大的字體顯示)。有了這個詞云,我們可以很容易地找到重要的客戶反饋,熱門的政治議程話題等。


		

數(shù)據(jù)集 https://opendatacommons.org/licenses/odbl/1-0/

導(dǎo)入數(shù)據(jù)集

importpandasaspd
data=pd.read_csv('/work/android-games.csv')
data.head()

output

4079271a-9198-11ed-bfe3-dac502259ad0.png

我們統(tǒng)計每個類別的數(shù)據(jù)數(shù)量


		

data.category.value_counts() GAMECARD126 GAMEWORD104 GAMEACTION100 GAMEADVENTURE100 GAMESTRATEGY100 GAMEPUZZLE100 GAMESIMULATION100 GAMECASUAL100 GAMEARCADE100 GAMEROLEPLAYING100 GAMETRIVIA100 GAMEBOARD100 GAMECASINO100 GAMERACING100 GAMEEDUCATIONAL100 GAMESPORTS100 GAMEMUSIC100 Name:category,dtype:int64

然后我們來進(jìn)行可視化。


		

#importingthemodulefromwordcloudlibrary fromwordcloudimportWordCloud importmatplotlib.pyplotasplt #creatingatextfromthecategorycolumnbytakingonlythe2ndpartofthecategory. text="".join(cat.split()[1]forcatindata.category) #generatingthecloud word_cloud=WordCloud(collocations=False,background_color='black').generate(text) plt.imshow(word_cloud,interpolation='bilinear') plt.axis("off") plt.show()

output

該圖表顯示了頻率最高的所有類別。我們也可以用這個圖從文本中找到經(jīng)常出現(xiàn)的單詞。

總結(jié)

數(shù)據(jù)可視化是數(shù)據(jù)科學(xué)中不可缺少的一部分。在數(shù)據(jù)科學(xué)中,我們與數(shù)據(jù)打交道。手工分析少量數(shù)據(jù)是可以的,但當(dāng)我們處理數(shù)千個數(shù)據(jù)時它就變得非常麻煩。如果我們不能發(fā)現(xiàn)數(shù)據(jù)集的趨勢和洞察力,我們可能無法使用這些數(shù)據(jù)。希望上面介紹的的圖可以幫助你深入了解數(shù)據(jù)。

以下是本文的引用

https://plotly.com/python/parallel-coordinates-plot/https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.plot.hexbin.html

Hintze, V. P. A Box Plot-Density Trace Synergism. Am. Sat, (52), 181 (Open Access Journal).

seaborn.pointplot — seaborn 0.12.1 documentation (pydata.org)

seaborn.swarmplot—seaborn0.12.1documentation(pydata.org)CreateasunburstchartinOffice—MicrosoftSupport

審核編輯 :李倩



聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7335

    瀏覽量

    94748
  • 可視化
    +關(guān)注

    關(guān)注

    1

    文章

    1352

    瀏覽量

    22787
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1236

    瀏覽量

    26187

原文標(biāo)題:總結(jié)歸納了10個超級實用的數(shù)據(jù)可視化圖表

文章出處:【微信號:DBDevs,微信公眾號:數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    物聯(lián)網(wǎng)平臺賦能可視化數(shù)據(jù)與決策,打造工廠“智慧大腦”

    ,無法形成全局視圖,更難以支撐快速、精準(zhǔn)的管理決策。 打造一集中、直觀、智能的數(shù)據(jù)可視化平臺,讓關(guān)鍵信息一目了然,讓管理決策有數(shù)可依,成為企業(yè)運營管理的迫切需求。數(shù)之能物聯(lián)網(wǎng)平臺具備高效可靠的
    的頭像 發(fā)表于 02-04 14:52 ?138次閱讀

    工業(yè)物聯(lián)網(wǎng)可視化平臺是什么?有什么功能?

    工業(yè)物聯(lián)網(wǎng)可視化平臺是基于物聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等技術(shù),將工業(yè)生產(chǎn)中的設(shè)備、系統(tǒng)、流程等數(shù)據(jù)以圖形方式呈現(xiàn),實現(xiàn)實時監(jiān)控、智能分析與交互式管理的數(shù)字化工具。 其核心功能涵蓋
    的頭像 發(fā)表于 11-17 17:49 ?1266次閱讀

    工業(yè)可視化平臺是什么

    工業(yè)可視化平臺是一種基于信息技術(shù)和可視化技術(shù),將工業(yè)生產(chǎn)過程中的數(shù)據(jù)、信息、流程等以直觀、動態(tài)的圖形方式呈現(xiàn),并實現(xiàn)交互式管理與分析的數(shù)字化工具。它通過整合工業(yè)物聯(lián)網(wǎng)(IIoT)、大
    的頭像 發(fā)表于 10-24 18:00 ?1058次閱讀

    光伏電站可視化的實現(xiàn)

    實現(xiàn)光伏電站可視化,核心是在于通過直觀的視覺界面,解決傳統(tǒng)運維中低效巡檢、數(shù)據(jù)孤島、被動響應(yīng)等痛點,從而提升運營效率并提供決策支持。這是一種有效的技術(shù)手段,通過數(shù)字孿生、三維建模、數(shù)據(jù)
    的頭像 發(fā)表于 10-21 17:29 ?1147次閱讀
    光伏電站<b class='flag-5'>可視化</b>的實現(xiàn)

    數(shù)字孿生可視化系統(tǒng)構(gòu)建行業(yè)數(shù)字智能管理生態(tài)!

    數(shù)字孿生可視化系統(tǒng)具備豐富的模型組件,包括二維平面組件及3D模型組件,可根據(jù)用戶需求進(jìn)行定制。數(shù)字孿生可視化系統(tǒng)在行業(yè)數(shù)字升級、數(shù)字管理中有著重要的意義,充分利用大
    的頭像 發(fā)表于 09-19 11:45 ?732次閱讀
    數(shù)字孿生<b class='flag-5'>可視化</b>系統(tǒng)構(gòu)建行業(yè)數(shù)字<b class='flag-5'>化</b>智能管理生態(tài)!

    智慧用電安全解決方案:打造全流程可視化管控

    預(yù)警、可視管控”的閉環(huán)管理體系,其核心在于實現(xiàn)對電氣安全風(fēng)險的全流程、可視化、主動性管控。 一、 全域感知與數(shù)據(jù)采集:可視化管控的數(shù)據(jù)基石
    的頭像 發(fā)表于 09-04 16:17 ?758次閱讀
    智慧用電安全解決方案:打造全流程<b class='flag-5'>可視化</b>管控

    如何使用協(xié)議分析儀進(jìn)行數(shù)據(jù)分析與可視化

    使用協(xié)議分析儀進(jìn)行數(shù)據(jù)分析與可視化,需結(jié)合數(shù)據(jù)捕獲、協(xié)議解碼、統(tǒng)計分析及可視化工具,將原始數(shù)據(jù)轉(zhuǎn)化為可解讀的
    發(fā)表于 07-16 14:16

    工業(yè)設(shè)備可視化管理系統(tǒng)是什么

    工業(yè)設(shè)備可視化管理系統(tǒng)是一種基于物聯(lián)網(wǎng)(IoT)、大數(shù)據(jù)、云計算、數(shù)字孿生等技術(shù),對工業(yè)設(shè)備的運行狀態(tài)、性能參數(shù)、維護(hù)信息等進(jìn)行實時監(jiān)測、數(shù)據(jù)整合與可視化呈現(xiàn)的智能管理平臺。它通過將復(fù)
    的頭像 發(fā)表于 05-27 14:56 ?1117次閱讀
    工業(yè)設(shè)備<b class='flag-5'>可視化</b>管理系統(tǒng)是什么

    結(jié)構(gòu)可視化:利用數(shù)據(jù)編輯器剖析數(shù)據(jù)內(nèi)在架構(gòu)?

    結(jié)構(gòu)可視化聚焦于展示數(shù)據(jù)的內(nèi)部結(jié)構(gòu)和各部分之間的關(guān)系,使企業(yè)能夠深入理解數(shù)據(jù)的組織方式和層次體系,從而更好地進(jìn)行數(shù)據(jù)管理和分析。通過結(jié)構(gòu)可視化
    的頭像 發(fā)表于 05-07 18:42 ?650次閱讀

    工業(yè)設(shè)備數(shù)據(jù)集中監(jiān)控可視化管理平臺是什么

    工業(yè)設(shè)備數(shù)據(jù)集中監(jiān)控可視化管理平臺是一種用于整合、監(jiān)控和可視化工業(yè)設(shè)備數(shù)據(jù)的綜合性系統(tǒng),旨在幫助企業(yè)實現(xiàn)設(shè)備數(shù)據(jù)的集中管理、實時監(jiān)控和
    的頭像 發(fā)表于 05-06 11:10 ?1059次閱讀

    VirtualLab Fusion應(yīng)用:3D系統(tǒng)可視化

    描述和F-Theta透鏡的應(yīng)用示例。 光學(xué)系統(tǒng)的3D-可視化 VirtualLab Fusion提供的工具可以實現(xiàn)光學(xué)系統(tǒng)的3D可視化,因此可以用于檢查元件的位置,以及快速了解系統(tǒng)內(nèi)部的光傳播情況
    發(fā)表于 04-30 08:47

    可視化組態(tài)物聯(lián)網(wǎng)平臺是什么

    可視化含義:組態(tài)是一種用于構(gòu)建復(fù)雜物聯(lián)網(wǎng)系統(tǒng)的工具,它提供了豐富的圖形組件和可視化元素,使得用戶可以通過簡單的拖拽操作來創(chuàng)建自定義的界面。可視化則強(qiáng)調(diào)將物聯(lián)網(wǎng)系統(tǒng)產(chǎn)生的大量
    的頭像 發(fā)表于 04-21 10:40 ?888次閱讀

    可視化組態(tài)數(shù)據(jù)管理平臺是什么

    可視化組態(tài)數(shù)據(jù)管理平臺是一種用于工業(yè)自動、物聯(lián)網(wǎng)、能源管理等領(lǐng)域的軟件平臺,它結(jié)合了可視化和組態(tài)技術(shù),幫助用戶實現(xiàn)數(shù)據(jù)的采集、管理、展示和
    的頭像 發(fā)表于 04-21 10:00 ?735次閱讀

    工業(yè)數(shù)據(jù)采集形成可視化數(shù)據(jù)看板解決方案

    可視化數(shù)據(jù)看板是一直觀、便捷的信息展示界面。通過把車間的實時生產(chǎn)數(shù)據(jù)、訂單進(jìn)度、設(shè)備狀態(tài)、產(chǎn)能效率率等,用清晰、可視化的形式展示出來,讓管
    的頭像 發(fā)表于 03-19 14:31 ?1159次閱讀
    工業(yè)<b class='flag-5'>數(shù)據(jù)</b>采集形成<b class='flag-5'>可視化</b><b class='flag-5'>數(shù)據(jù)</b>看板解決方案