欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python數(shù)據(jù)可視化探索實(shí)例分享

 更新時間:2022年05月22日 09:48:57   作者:Python編程學(xué)習(xí)圈  
這篇文章主要介紹了Python數(shù)據(jù)可視化探索實(shí)例分享,數(shù)據(jù)可視化是指用圖形或表格的方式來呈現(xiàn)數(shù)據(jù),關(guān)于更多相關(guān)介紹需要的小伙伴可以參考下面文章的具體內(nèi)容

一、數(shù)據(jù)可視化與探索圖

數(shù)據(jù)可視化是指用圖形或表格的方式來呈現(xiàn)數(shù)據(jù)。圖表能夠清楚地呈現(xiàn)數(shù)據(jù)性質(zhì), 以及數(shù)據(jù)間或?qū)傩蚤g的關(guān)系,可以輕易地讓人看圖釋義。用戶通過探索圖(Exploratory Graph)可以了解數(shù)據(jù)的特性、尋找數(shù)據(jù)的趨勢、降低數(shù)據(jù)的理解門檻。

二、常見的圖表實(shí)例

本章主要采用 Pandas 的方式來畫圖,而不是使用 Matplotlib 模塊。其實(shí) Pandas 已經(jīng)把 Matplotlib 的畫圖方法整合到 DataFrame 中,因此在實(shí)際應(yīng)用中,用戶不需要直接引用 Matplotlib 也可以完成畫圖的工作。

1.折線圖

折線圖(line chart)是最基本的圖表,可以用來呈現(xiàn)不同欄位連續(xù)數(shù)據(jù)之間的關(guān)系。繪制折線圖使用的是 plot.line() 的方法,可以設(shè)置顏色、形狀等參數(shù)。在使用上,拆線圖繪制方法完全繼承了 Matplotlib 的用法,所以程序最后也必須調(diào)用 plt.show() 產(chǎn)生圖,如圖8.4 所示。

df_iris[['sepal?length?(cm)']].plot.line()
plt.show()
ax?=?df[['sepal?length?(cm)']].plot.line(color='green',title="Demo",style='--')
ax.set(xlabel="index",?ylabel="length")
plt.show()

2.散布圖

散布圖(Scatter Chart)用于檢視不同欄位離散數(shù)據(jù)之間的關(guān)系。繪制散布圖使用的是 df.plot.scatter(),如圖8.5所示。

df?=?df_iris
df.plot.scatter(x='sepal?length?(cm)',?y='sepal?width?(cm)')
from?matplotlib?import?cm
cmap?=?cm.get_cmap('Spectral')
df.plot.scatter(x='sepal?length?(cm)',
??????????y='sepal?width?(cm)',
??????????s=df[['petal?length?(cm)']]*20,
??????????c=df['target'],
??????????cmap=cmap,
??????????title='different?circle?size?by?petal?length?(cm)')

3.直方圖、長條圖

直方圖(Histogram Chart)通常用于同一欄位,呈現(xiàn)連續(xù)數(shù)據(jù)的分布狀況,與直方圖類似的另一種圖是長條圖(Bar Chart),用于檢視同一欄位,如圖 8.6 所示。

df[['sepal?length?(cm)',?'sepal?width?(cm)',?'petal?length?(cm)','petal?width?(cm)']].plot.hist()
2?df.target.value_counts().plot.bar()

4. 圓餅圖、箱形圖

圓餅圖(Pie Chart)可以用于檢視同一欄位各類別所占的比例,而箱形圖(Box Chart)則用于檢視同一欄位或比較不同欄位數(shù)據(jù)的分布差異,如圖 8.7 所示。

df.target.value_counts().plot.pie(legend=True)
df.boxplot(column=['target'],?gsize=(10,5))

數(shù)據(jù)探索實(shí)戰(zhàn)分享:

本節(jié)利用兩個真實(shí)的數(shù)據(jù)集實(shí)際展示數(shù)據(jù)探索的幾種手法。

三、社區(qū)調(diào)查

在美國社區(qū)調(diào)查(American Community Survey)中,每年約有 350 萬個家庭被問到關(guān)于他們是誰及他們?nèi)绾紊畹脑敿?xì)問題。調(diào)查的內(nèi)容涵蓋了許多主題,包括祖先、教育、工作、交通、互聯(lián)網(wǎng)使用和居住。

數(shù)據(jù)名稱:2013 American Community Survey。

先觀察數(shù)據(jù)的樣子與特性,以及每個欄位代表的意義、種類和范圍。

#?讀取數(shù)據(jù)
df?=?pd.read_csv("./ss13husa.csv")
#?欄位種類數(shù)量
df.shape
#?(756065,231)
#?欄位數(shù)值范圍
df.describe()

先將兩個 ss13pusa.csv 串連起來,這份數(shù)據(jù)總共包含 30 萬筆數(shù)據(jù),3 個欄位:SCHL ( 學(xué)歷,School Level)、 PINCP ( 收入,Income) 和 ESR ( 工作狀態(tài),Work Status)。

pusa?=?pd.read_csv("ss13pusa.csv")?pusb?=?pd.read_csv("ss13pusb.csv")
#?串接兩份數(shù)據(jù)
col?=?['SCHL','PINCP','ESR']
df['ac_survey']?=?pd.concat([pusa[col],pusb[col],axis=0)

依據(jù)學(xué)歷對數(shù)據(jù)進(jìn)行分群,觀察不同學(xué)歷的數(shù)量比例,接著計(jì)算他們的平均收入。

group?=?df['ac_survey'].groupby(by=['SCHL'])?print('學(xué)歷分布:'?+?group.size())
group?=?ac_survey.groupby(by=['SCHL'])?print('平均收入:'?+group.mean())

四、波士頓房屋數(shù)據(jù)集

波士頓房屋數(shù)據(jù)集(Boston House Price Dataset)包含有關(guān)波士頓地區(qū)的房屋信息, 包 506 個數(shù)據(jù)樣本和 13 個特征維度。

數(shù)據(jù)名稱:Boston House Price Dataset。

先觀察數(shù)據(jù)的樣子與特性,以及每個欄位代表的意義、種類和范圍。

可以用直方圖的方式畫出房價(MEDV)的分布,如圖 8.8 所示。

df?=?pd.read_csv("./housing.data")
#?欄位種類數(shù)量
df.shape
#?(506,?14)
#欄位數(shù)值范圍df.describe()
import?matplotlib.pyplot?as?plt
df[['MEDV']].plot.hist()
plt.show()

注:圖中英文對應(yīng)筆者在代碼中或數(shù)據(jù)中指定的名字,實(shí)踐中讀者可將它們替換成自己需要的文字。

接下來需要知道的是哪些維度與“房價”關(guān)系明顯。先用散布圖的方式來觀察,如圖8.9所示。

#?draw?scatter?chart
df.plot.scatter(x='MEDV',?y='RM')?.
plt.show()

最后,計(jì)算相關(guān)系數(shù)并用聚類熱圖(Heatmap)來進(jìn)行視覺呈現(xiàn),如圖 8.10 所示。

#?compute?pearson?correlation
corr?=?df.corr()
#?draw??heatmap
import?seaborn?as?sns
corr?=?df.corr()
sns.heatmap(corr)
plt.show()

顏色為紅色,表示正向關(guān)系;顏色為藍(lán)色,表示負(fù)向關(guān)系;顏色為白色,表示沒有關(guān)系。RM 與房價關(guān)聯(lián)度偏向紅色,為正向關(guān)系;LSTAT、PTRATIO 與房價關(guān)聯(lián)度偏向深藍(lán), 為負(fù)向關(guān)系;CRIM、RAD、AGE 與房價關(guān)聯(lián)度偏向白色,為沒有關(guān)系。

到此這篇關(guān)于Python數(shù)據(jù)可視化探索實(shí)例分享的文章就介紹到這了,更多相關(guān)Python數(shù)據(jù)可視化內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • Pytorch圖像處理注意力機(jī)制解析及代碼詳解

    Pytorch圖像處理注意力機(jī)制解析及代碼詳解

    這篇文章主要為大家介紹了Pytorch圖像處理注意力機(jī)制解析及代碼詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪
    2022-05-05
  • django中操作mysql數(shù)據(jù)庫的方法

    django中操作mysql數(shù)據(jù)庫的方法

    對象關(guān)系映射模式是一種為了解決面向?qū)ο笈c關(guān)系數(shù)據(jù)庫存在的互不匹配的現(xiàn)象的技術(shù),這篇文章主要介紹了django中操作mysql數(shù)據(jù)庫的方法,需要的朋友可以參考下
    2022-09-09
  • python實(shí)現(xiàn)簡易猜數(shù)小游戲

    python實(shí)現(xiàn)簡易猜數(shù)小游戲

    大家好,本篇文章主要講的是python實(shí)現(xiàn)簡易猜數(shù)小游戲,感興趣的同學(xué)趕快來看一看吧,對你有幫助的話記得收藏一下,方便下次瀏覽
    2022-01-01
  • python實(shí)現(xiàn)梯度下降法

    python實(shí)現(xiàn)梯度下降法

    這篇文章主要為大家詳細(xì)介紹了python實(shí)現(xiàn)梯度下降法,文中示例代碼介紹的非常詳細(xì),具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2020-03-03
  • numpy返回array中元素的index方法

    numpy返回array中元素的index方法

    今天小編就為大家分享一篇numpy返回array中元素的index方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2018-06-06
  • python中break、continue 、exit() 、pass終止循環(huán)的區(qū)別詳解

    python中break、continue 、exit() 、pass終止循環(huán)的區(qū)別詳解

    這篇文章主要介紹了python中break、continue 、exit() 、pass終止循環(huán)的區(qū)別詳解,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-07-07
  • 如何利用pygame實(shí)現(xiàn)簡單的五子棋游戲

    如何利用pygame實(shí)現(xiàn)簡單的五子棋游戲

    這篇文章主要給大家介紹了關(guān)于如何利用pygame實(shí)現(xiàn)簡單的五子棋游戲的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),對大家學(xué)習(xí)或者使用pygame具有一定的參考學(xué)習(xí)價值,需要的朋友們下面來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-12-12
  • Django開發(fā)中復(fù)選框用法示例

    Django開發(fā)中復(fù)選框用法示例

    這篇文章主要介紹了Django開發(fā)中復(fù)選框用法,結(jié)合實(shí)例形式分析了Django基于ajax的復(fù)選框遍歷、提交及后臺數(shù)據(jù)庫查詢等相關(guān)操作技巧,需要的朋友可以參考下
    2018-03-03
  • 深入探討Python中的RegEx模式匹配

    深入探討Python中的RegEx模式匹配

    正則表達(dá)式通??s寫為?regex,是處理文本的有效工具,這篇文章主要來和大家深入探討一下Python中的RegEx模式匹配,感興趣的可以了解一下
    2023-07-07
  • 基于wxPython的GUI實(shí)現(xiàn)輸入對話框(1)

    基于wxPython的GUI實(shí)現(xiàn)輸入對話框(1)

    這篇文章主要為大家詳細(xì)介紹了基于wxPython的GUI實(shí)現(xiàn)簡單的輸入對話框,具有一定的參考價值,感興趣的小伙伴們可以參考一下
    2019-02-02

最新評論