python?matplotlib繪畫十一種常見數(shù)據(jù)分析圖
1. 折線圖
折線圖(Line Chart)是一種將數(shù)據(jù)點(diǎn)按照順序連接起來(lái)的圖形,也可以看作是將散點(diǎn)圖按照X軸坐標(biāo)順序鏈接起來(lái)的圖形。折線圖的主要功能是查看因變量y隨著自變量x改變的趨勢(shì),最適合用于顯示隨時(shí)間(根據(jù)常用比例設(shè)置)而改變的連續(xù)數(shù)據(jù)。同時(shí),還可以看出數(shù)量的差異
繪制折線圖plot的格式:
matplotlib.pyplot.plot(*args,**kwargs)
color參數(shù)的8種常用的縮寫見表
表2 color參數(shù)的常用顏色縮寫:
plt.plot繪制折線圖代碼展示:
import matplotlib.pyplot as plt import numpy as np %matplotlib inline x = np.arange(9) y = np.sin(x) z = np.cos(x) #marker數(shù)據(jù)點(diǎn)樣式,linewidth線寬,linestyle線型樣式,color顏色 plt.plot(x,y,marker='*',linewidth=1,linestyle='--',color='orange') plt.plot(x,z) plt.title('matplotlib AK') plt.xlabel('height',fontsize=15) plt.ylabel('width',fontsize=15) #設(shè)置圖例 plt.legend(['Y','Z'],loc='upper right') plt.grid(True) plt.show()
2. 散點(diǎn)圖
散點(diǎn)圖(Scatter Diagram)又稱為散點(diǎn)分布圖,是以一個(gè)特征為橫坐標(biāo),另一個(gè)特征為縱坐標(biāo),使用坐標(biāo)點(diǎn)(散點(diǎn))的分布形態(tài)反映特征間統(tǒng)計(jì)關(guān)系的一種圖形。值時(shí)由點(diǎn)在圖表中的位置表示,類別是由圖表中的不同標(biāo)記表示 ,通常用于比較跨類別的數(shù)據(jù)
scatter方法的格式:
matplotlib.pyplot.scatter(x,y,s=None,c=None,marker=None,alpha=None)
scatter函數(shù)主要參數(shù)及其說(shuō)明見表3scatter的主要參數(shù)及其說(shuō)明
scatter繪圖示例1:
fig.ax = plt.subplots() plt.rcParams['font.family'] = ['SimHei'] #用來(lái)顯示中文標(biāo)簽 plt.rcParams['axes.unicode_minus'] = False #用來(lái)正常顯示符號(hào) x1 = np.arange(1,30) y1 = np.sin(x1) ax1 = plt.subplot(1,1,1) plt.title('散點(diǎn)圖 AK') plt.xlabel('X') plt.ylabel('Y') lvalue = x1 ax1.scatter(x1,y1,c='r',s=100,linewidths=lvalue,marker='o') plt.legend('x1') plt.show(),
scatter繪圖示例2:
fig,ax = plt.subplots() plt.rcParams['font.family'] = ['SimHei'] #用來(lái)顯示中文標(biāo)簽 plt.rcParams['axes.unicode_minus'] = False #用來(lái)正常顯示符號(hào) for color in ['red','green','blue']: n = 500 x,y = np.random.randn(2,n) ax.scatter(x,y,c=color,label=color,alpha=0.3,edgecolor='none') ax.legend() ax.grid(True) plt.show()
3. 直方圖
直方圖(Histogram)又稱質(zhì)量分布圖,是統(tǒng)計(jì)報(bào)告圖的一種,由一系列高度不等的縱向條紋或線段表示數(shù)據(jù)分布的情況,一般用橫軸表示數(shù)據(jù)所屬類別,縱軸表示數(shù)量或者占比。用直方圖可以比較直觀地看出產(chǎn)品質(zhì)量特性的分布狀態(tài),便于判斷其總體質(zhì)量分布情況。直方圖可以發(fā)現(xiàn)分布表無(wú)法發(fā)現(xiàn)的數(shù)據(jù)模式、樣本的頻率分布和總體的分布。
繪制直方圖函數(shù)bar格式:
matplotlib.pyplot.bar(left,height,width = 0.8,bottom = None,hold = None,data = None)
函數(shù)bar的常用參數(shù)及其說(shuō)明見下表4
表4 bar常用參數(shù)及其說(shuō)明:
bar繪圖示例1:
import pandas as pd import matplotlib.pyplot as plt import numpy as np fig,axes = plt.subplots(2,1) data = pd.Series(np.random.randn(16),index=list('abcdefghijklmnop')) data.plot.bar(ax = axes[0],color='k',alpha=0.7) data.plot.barh(ax = axes[1],color='k',alpha=0.7)
bar繪圖示例2:
import pandas as pd import matplotlib.pyplot as plt import numpy as np plt.rcParams['font.family'] = ['SimHei'] #用來(lái)顯示中文標(biāo)簽 plt.rcParams['axes.unicode_minus'] = False #用來(lái)正常顯示符號(hào) fig,ax = plt.subplots() x = np.arange(1,6) y1 = np.random.uniform(1.5,1.0,5) y2 = np.random.uniform(1.5,1.0,5) plt.bar(x,y1,width = 0.35,facecolor='lightskyblue',edgecolor = 'white') plt.bar(x+0.35,y2,width = 0.35,facecolor='yellowgreen',edgecolor = 'white') plt.show()
4. 餅圖
餅圖(Pie Graph)用于表示不同分類的占比情況,通過(guò)弧度大小來(lái)對(duì)比各種分類,餅圖可以比較清楚的反映出部分與部分、部分與整體之間的比例關(guān)系,易于顯示每組數(shù)據(jù)相對(duì)于總數(shù)的大小,而且顯現(xiàn)的方式直觀。
繪制餅圖pie方法的格式:
matplotlib.pyplot.pie(x,explode = None,labels = None,color = None,autopct = None, pctdistance = 0.6,shadow=false,labeldistance=1.1,startangle=None,radius=None,...)
pie函數(shù)常用參數(shù)及其說(shuō)明見表5
表5 pie函數(shù)常用參數(shù)及其說(shuō)明:
pie繪圖示例:
plt.figure(figsize=(6,6)) #建立軸的大小 labels = ['Springs','Summer','Autumn','Winter'] x = [15,30,45,10] explode = (0.05,0.05,0.05,0.05) #這個(gè)是控制分離的距離的,默認(rèn)餅圖不分離 plt.pie(x,labels = labels,explode = explode,startangle = 60,autopct='%1.1f%%') #autopct在圖中顯示比例值,注意值的格式 plt.title('Rany days by season') plt.show()
5. 箱線圖
箱線圖(Boxplot)也稱盒須圖,通過(guò)繪制反映數(shù)據(jù)分布特征的統(tǒng)計(jì)量,提供有關(guān)數(shù)據(jù)位置和分散情況的關(guān)鍵信息,尤其在比較不同特征時(shí),更可表現(xiàn)其分散程度差異。箱線圖使用數(shù)據(jù)中的5個(gè)統(tǒng)計(jì)量(最小值,下四分位數(shù),中位數(shù),上四分位數(shù)和最大值)來(lái)描述數(shù)據(jù),它可以粗略地看出數(shù)據(jù)是否具有對(duì)稱性,分布的分散程度等信息,特別可以用于對(duì)幾個(gè)樣本的比較,還可以粗略檢測(cè)異常值。
boxplot函數(shù)的格式:
matplotlib.pyplot.boxplot(x,notch = None,sym = None,vert = None,whis = None, positions = None,width = None,patch_artist = None, meanline = None,labels = None,...)
boxplot函數(shù)常用參數(shù)及其說(shuō)明見表6
表6 boxplot函數(shù)常用參數(shù)及其說(shuō)明:
import numpy as np import pandas as pd import matplotlib.pyplot as plt np.random.seed(2)#設(shè)置隨機(jī)種子 df = pd.DataFrame(np.random.rand(5,4),columns = ['A','B','C','D']) #生成0~1的5*4維度數(shù)據(jù)并存入4列DataFrame中 df.boxplot() plt.show()
6.概率圖
概率圖模型時(shí)圖靈獲得者Pearl提出的用來(lái)表示變量間概率依賴關(guān)系的理論,正態(tài)分布又名高斯分布。正太概率密度函數(shù)normpdf(X,mu,sigma),其中,X為向量,mu為均值,sigma為標(biāo)準(zhǔn)差。
繪制概率圖:
import numpy as np import pandas as pd import matplotlib.pyplot as plt from scipy.stats import norm fig,ax = plt.subplots() plt.rcParams['font.family'] = ['SimHei'] #用來(lái)顯示中文標(biāo)簽 plt.rcParams['axes.unicode_minus'] = False #用來(lái)正常顯示符號(hào) np.random.seed(1587554) mu = 100 sigma = 15 x = mu+sigma*np.random.randn(437) num_bins = 50 n,bins,patches = ax.hist(x,num_bins,density=1,stacked=True) y = norm.pdf(bins,mu,sigma) ax.plot(bins,y,'--') fig.tight_layout() plt.show()
7.雷達(dá)圖
雷達(dá)圖也稱網(wǎng)絡(luò)圖、星圖、蜘蛛網(wǎng)圖、不規(guī)則多邊形、極坐標(biāo)圖等。雷達(dá)圖是以從同一點(diǎn)開始的軸上表示的三個(gè)或更多個(gè)定量變量的二維圖表的形式顯示多變量數(shù)據(jù)的圖形方法。軸的相對(duì)位置和角度通常是無(wú)信息的。雷達(dá)圖相當(dāng)于平行坐標(biāo)圖,軸徑向排列。
繪制某學(xué)生成績(jī)信息的雷達(dá)圖
import matplotlib.pyplot as plt import numpy as np %matplotlib inline #某學(xué)生的課程與成績(jī) courses = ['數(shù)據(jù)結(jié)構(gòu)','數(shù)據(jù)可視化','高數(shù)','英語(yǔ)','軟件工程','組成原理','C語(yǔ)言','體育'] scores = [82,95,78,85,45,88,76,88] dataLength = len(scores) #數(shù)據(jù)長(zhǎng)度 #angles數(shù)組把圓周等分為dataLength份 angles = np.linspace(0,2*np.pi,dataLength,endpoint=False) scores.append(scores[0]) angless = np.append(angles,angles[0]) #閉合 #繪制雷達(dá)圖 plt.polar(angless, #設(shè)置角度 scores, #設(shè)置各個(gè)角度上的數(shù)據(jù) 'rv--', #設(shè)置顏色、線型和端點(diǎn)符號(hào) linewidth=2) #設(shè)置線寬 #設(shè)置角度網(wǎng)絡(luò)標(biāo)簽 plt.thetagrids(angles*180/np.pi,courses,fontproperties='simhei',fontsize=12,color='k') #填充雷達(dá)圖內(nèi)部 plt.fill(angless,scores,facecolor='g',alpha=0.2) plt.show()
8.流向圖
在運(yùn)輸問(wèn)題中,常常需要表明產(chǎn)地的產(chǎn)量、銷地的銷量,以及流向和流量的交通圖,此時(shí)可以用到流向圖。流向圖能夠直觀地展示數(shù)據(jù)流向,揭示出運(yùn)動(dòng)中的一些規(guī)律或現(xiàn)象。
流向圖繪制:
import numpy as np import matplotlib.pyplot as plt Y,X = np.mgrid[-3:3:100j,-3:3:100j] U = -1-X**2+Y V = 1+X-Y**2 speed = np.sqrt(U*U+V*V) plt.streamplot(X,Y,U,V,color=U,linewidth = 2,cmap = plt.cm.autumn) plt.colorbar() f,(ax1,ax2) = plt.subplots(ncols=2) ax1.streamplot(X,Y,U,V,density=[0.5,1]) lw = 5*speed/speed.max() ax2.streamplot(X,Y,U,V,density=0.6,color='k',linewidth=lw) plt.show()
9.繪圖中的表格設(shè)置
在繪圖中,有時(shí)候需要同時(shí)顯示數(shù)據(jù)表格。Matplotlib在繪圖中提供了table方法可以同時(shí)顯示數(shù)據(jù)表格
在繪圖中顯示數(shù)據(jù)表格;
import numpy as np import matplotlib.pyplot as plt plt.rcParams['font.family'] = ['SimHei'] data = [[66386,174296,75131,577908,32015], [58230,381139,78045,99308,160454], [89135,80552,152558,497981,603535], [78415,81858,150656,193263,69638], [139361,331509,343164,781380,52269]] columns = ('Freeze','Wind','Flood','Quake','Hail') rows = ['%d year'% x for x in (100,50,20,10,5)] values = np.arange(0,2500,500) value_increment = 1000 colors = plt.cm.BuPu(np.linspace(0,0.5,len(columns))) n_rows=len(data) index = np.arange(len(columns))+0.3 bar_width=0.4 y_offset = np.array([0.0]*len(columns)) cell_text = [] for row in range(n_rows): plt.bar(index,data[row],bar_width,bottom=y_offset) y_offset = y_offset+data[row] cell_text.append(['%1.1f'%(x/1000.0) for x in y_offset]) colors = colors[::-1] cell_text.reverse() the_table = plt.table(cellText=cell_text, rowLabels=rows, rowColours = colors, colLabels = columns, loc = 'bottom') plt.subplots_adjust(left=0.2,bottom=0.2) plt.ylabel("Loss in ${0}'s".format(value_increment)) plt.yticks(values*value_increment,['%d' % val for val in values]) plt.xticks([]) plt.title('氣象災(zāi)害損失') plt.show()
10. 極坐標(biāo)圖
在平面投影中,由X軸和Y軸定位坐標(biāo);而在極坐標(biāo)投影中,需要以半徑和角度的形式定位坐標(biāo)。極坐標(biāo)投影中的半徑以圓半徑的大小顯示,并且以每個(gè)角度為0°的圓的角度為起點(diǎn)投影角度。要生成極坐標(biāo)投影,需要將投影類型定義為極坐標(biāo)。
繪制極坐標(biāo)圖:
import numpy as np import matplotlib.pyplot as plt r = np.linspace(0,2,100) theta = 2*np.pi*r fig = plt.figure(figsize=(13,4)) ax1 = plt.subplot(121,projection='polar') ax1.scatter(theta,r,label='Polar Projection',s=10) ax1.legend(bbox_to_anchor=(0.85,1.35)) ax2 = plt.subplot(122) ax2.scatter(theta,r,label='Polar Projection',s=10) ax2.legend(bbox_to_anchor=(0.85,1.35)) ax2.set_xlabel('R') ax2.set_ylabel(r'$\theta$')
11. 詞云圖
詞云用于對(duì)網(wǎng)絡(luò)文本中出現(xiàn)頻率較高的關(guān)鍵詞予以視覺上的突出,形成“關(guān)鍵詞云層”或“關(guān)鍵詞渲染”,從而過(guò)濾掉大量的文本信息,使瀏覽網(wǎng)頁(yè)者只需要一眼掃過(guò)文本就可以領(lǐng)略文本的主旨。
11.1 安裝相關(guān)的包
繪制詞需要WordCloud和jieba包。jieba用于從文本的句子里分割出詞匯。
兩個(gè)包的安裝語(yǔ)句:
pip install wordcloudpip install jieba
11.2 詞云生成過(guò)程
一般生成詞云的過(guò)程為:
- 1)使用Pandas讀取數(shù)據(jù)并將需要分析的數(shù)據(jù)轉(zhuǎn)化為列表
- 2)對(duì)獲得的列表數(shù)據(jù)使用分詞工具jieba進(jìn)行遍歷分詞
- 3)使用WordCloud設(shè)置詞云圖片的屬性、掩碼和停用詞,并生成詞云圖像。
到此這篇關(guān)于python matplotlib繪畫十一種常見數(shù)據(jù)分析圖的文章就介紹到這了,更多相關(guān)python matplotlib 繪圖內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
pytorch 批次遍歷數(shù)據(jù)集打印數(shù)據(jù)的例子
今天小編就為大家分享一篇pytorch 批次遍歷數(shù)據(jù)集打印數(shù)據(jù)的例子,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-12-12Python字符串處理實(shí)現(xiàn)單詞反轉(zhuǎn)
這篇文章主要為大家詳細(xì)介紹了Python字符串處理實(shí)現(xiàn)單詞反轉(zhuǎn)的方法,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2017-06-06關(guān)于Keras模型可視化教程及關(guān)鍵問(wèn)題的解決
今天小編就為大家分享一篇關(guān)于Keras模型可視化教程及關(guān)鍵問(wèn)題的解決,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-01-01python使用PIL把透明背景圖片轉(zhuǎn)成白色背景的示例代碼
當(dāng)我們?cè)诓杉恍﹫D片的時(shí)候,這些圖片的背景經(jīng)常是透明的,但是如何把透明背景轉(zhuǎn)成白色背景呢,接下來(lái)就給大家解決這個(gè)問(wèn)題,本文主要介紹了python使用PIL把透明背景圖片轉(zhuǎn)成白色背景,需要的朋友可以參考下2023-08-08python+selenium自動(dòng)化實(shí)戰(zhàn)攜帶cookies模擬登陸微博
這篇文章主要介紹了python+selenium自動(dòng)化實(shí)戰(zhàn)攜帶cookies模擬登陸微博,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2021-01-01