欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python數(shù)據(jù)分析:手把手教你用Pandas生成可視化圖表的教程

 更新時間:2018年12月15日 12:21:20   作者:刺客五六柒  
今天小編就為大家分享一篇Python數(shù)據(jù)分析:手把手教你用Pandas生成可視化圖表的教程,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧

大家都知道,Matplotlib 是眾多 Python 可視化包的鼻祖,也是Python最常用的標準可視化庫,其功能非常強大,同時也非常復(fù)雜,想要搞明白并非易事。但自從Python進入3.0時代以后,pandas的使用變得更加普及,它的身影經(jīng)常見于市場分析、爬蟲、金融分析以及科學(xué)計算中。

作為數(shù)據(jù)分析工具的集大成者,pandas作者曾說,pandas中的可視化功能比plt更加簡便和功能強大。實際上,如果是對圖表細節(jié)有極高要求,那么建議大家使用matplotlib通過底層圖表模塊進行編碼。當然,我們大部分人在工作中是不會有這樣變態(tài)的要求的,所以一句import pandas as pd就足夠應(yīng)付全部的可視化工作了。

下面,我們總結(jié)一下PD庫的一些使用方法和入門技巧。

一、線型圖

對于pandas的內(nèi)置數(shù)據(jù)類型,Series 和 DataFrame 都有一個用于生成各類 圖表 的 plot 方法。 默認情況下, 它們所生成的是線型圖。其實Series和DataFrame上的這個功能只是使用matplotlib庫的plot()方法的簡單包裝實現(xiàn)。參考以下示例代碼 -

import pandas as pd
import numpy as np
 
df = pd.DataFrame(np.random.randn(10,4),index=pd.date_range('2018/12/18',
 periods=10), columns=list('ABCD'))
 
df.plot()

執(zhí)行上面示例代碼,得到以下結(jié)果 -

Pandas生成可視化圖表

如果索引由日期組成,則調(diào)用gct().autofmt_xdate()來格式化x軸,如上圖所示。

我們可以使用x和y關(guān)鍵字繪制一列與另一列。

s = Series( np. random. randn( 10). cumsum(), index= np. arange( 0, 100, 10))
s. plot()

Pandas生成可視化圖表

pandas 的大部分繪圖方法都有 一個 可選的ax參數(shù), 它可以是一個 matplotlib 的 subplot 對象。 這使你能夠在網(wǎng)格 布局 中 更為靈活地處理 subplot 的位置。 DataFrame的plot 方法會在 一個 subplot 中為各列繪制 一條 線, 并自動創(chuàng)建圖例( 如圖所示):

df = DataFrame( np. random. randn( 10, 4). cumsum( 0), ...: columns=[' A', 'B', 'C', 'D'], index= np. arange( 0, 100, 10)) 
 
df. plot() 

Pandas生成可視化圖表

二、柱狀圖

在生成線型圖的代碼中加上 kind=' bar'( 垂直柱狀圖) 或 kind=' barh'( 水平柱狀圖) 即可生成柱狀圖。 這時,Series 和 DataFrame 的索引將會被用 作 X( bar) 或 (barh)刻度:

In [59]: fig, axes = plt. subplots( 2, 1) 
 
In [60]: data = Series( np. random. rand( 16), index= list(' abcdefghijklmnop')) 
 
In [61]: data. plot( kind=' bar', ax= axes[ 0], color=' k', alpha= 0. 7) 
 
Out[ 61]: < matplotlib. axes. AxesSubplot at 0x4ee7750> 
 
In [62]: data. plot( kind=' barh', ax= axes[ 1], color=' k', alpha= 0.

對于 DataFrame, 柱狀 圖 會 將 每一 行的 值 分為 一組, 如圖 8- 16 所示:

In [63]: df = DataFrame( np. random. rand( 6, 4), ...: index=[' one', 'two', 'three', 'four', 'five', 'six'], ...: columns= pd. Index([' A', 'B', 'C', 'D'], name=' Genus')) 
 
In [64]: df 
 
Out[ 64]: 
 
Genus 
 
   A   B   C   D 
one 0. 301686 0. 156333 0. 371943 0. 270731 
two 0. 750589 0. 525587 0. 689429 0. 358974 
three 0. 381504 0. 667707 0. 473772 0. 632528 
four 0. 942408 0. 180186 0. 708284 0. 641783 
five 0. 840278 0. 909589 0. 010041 0. 653207 
six 0. 062854 0. 589813 0. 811318 0. 060217 
 
In [65]: df. plot( kind=' bar')

Pandas生成可視化圖表

三、條形圖

現(xiàn)在通過創(chuàng)建一個條形圖來看看條形圖是什么。條形圖可以通過以下方式來創(chuàng)建 -

import pandas as pd
import numpy as np
 
df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d'])
df.plot.bar()

執(zhí)行上面示例代碼,得到以下結(jié)果 -

Pandas生成可視化圖表

要生成一個堆積條形圖,通過指定:pass stacked=True -

import pandas as pd
df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d'])
df.plot.bar(stacked=True)

執(zhí)行上面示例代碼,得到以下結(jié)果 -

Pandas生成可視化圖表

要獲得水平條形圖,使用barh()方法 -

import pandas as pd
import numpy as np
 
df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d'])
 
df.plot.barh(stacked=True)

四、直方圖

可以使用plot.hist()方法繪制直方圖。我們可以指定bins的數(shù)量值。

import pandas as pd
import numpy as np
 
df = pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c':
np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])
 
df.plot.hist(bins=20)

執(zhí)行上面示例代碼,得到以下結(jié)果 -

Pandas生成可視化圖表

要為每列繪制不同的直方圖,請使用以下代碼 -

import pandas as pd
import numpy as np
 
df=pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c':
np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])
 
df.hist(bins=20)

執(zhí)行上面示例代碼,得到以下結(jié)果 -

Pandas生成可視化圖表

五、箱型圖

Boxplot可以繪制調(diào)用Series.box.plot()和DataFrame.box.plot()或DataFrame.boxplot()來可視化每列中值的分布。

例如,這里是一個箱形圖,表示對[0,1)上的統(tǒng)一隨機變量的10次觀察的五次試驗。

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E'])
df.plot.box()

執(zhí)行上面示例代碼,得到以下結(jié)果 -

Pandas生成可視化圖表

六、塊型圖

可以使用Series.plot.area()或DataFrame.plot.area()方法創(chuàng)建區(qū)域圖形。

import pandas as pd
import numpy as np
 
df = pd.DataFrame(np.random.rand(10, 4), columns=['a', 'b', 'c', 'd'])
df.plot.area()

執(zhí)行上面示例代碼,得到以下結(jié)果 -

Pandas生成可視化圖表

七、散點圖

可以使用DataFrame.plot.scatter()方法創(chuàng)建散點圖。

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(50, 4), columns=['a', 'b', 'c', 'd'])
df.plot.scatter(x='a', y='b')

執(zhí)行上面示例代碼,得到以下結(jié)果 -

Pandas生成可視化圖表

八、餅狀圖

餅狀圖可以使用DataFrame.plot.pie()方法創(chuàng)建。

import pandas as pd
import numpy as np
 
df = pd.DataFrame(3 * np.random.rand(4), index=['a', 'b', 'c', 'd'], columns=['x'])
df.plot.pie(subplots=True)

執(zhí)行上面示例代碼,得到以下結(jié)果 -

Pandas生成可視化圖表

以上這篇Python數(shù)據(jù)分析:手把手教你用Pandas生成可視化圖表的教程就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。

相關(guān)文章

最新評論