Python高級(jí)數(shù)據(jù)分析之pandas和matplotlib繪圖
一、matplotlib 庫(kù)
一個(gè)用來(lái)繪圖的庫(kù)
import matplotlib.pyplot as plt
1)plt.imread(“圖片路徑”)
功能: 將圖片加載后返回一個(gè)維數(shù)組
>>> jin = plt.imread("./jin.png") >>> jin array([[[0.24313726, 0.24313726, 0.24705882], ..., [0.7294118 , 0.7294118 , 0.7294118 ]]], dtype=float32) >>> jin.shpae (273, 411, 3) ''' 這是一個(gè)三維數(shù)組 第一層代表將圖片分成273行, 第二層代表將圖片的第一層的每一行分為411列, 第三層代表將每一像素點(diǎn)中的(R,G,B) 注意:有些圖片加載后最內(nèi)層有4個(gè)元素,分別是(R,G,B,A[阿爾法/透明度]) '''
2)plt.imshow(ndarray)顯示圖片
功能: 將多維數(shù)組渲染為一張圖片
>>> plt.imshow(nd) #將加載后的多維數(shù)組傳入就可以將圖片渲染出來(lái) ''' 有的圖片加載出來(lái)之后數(shù)據(jù)范圍在0-255之間的需要將數(shù)據(jù)/255之后轉(zhuǎn)化為0-1之間的就可以和0-1的圖片進(jìn)行合并操作 '''
這里就可以將圖片進(jìn)行處理(反轉(zhuǎn),拉伸,改色)等操作
3)plt.imsave(ndarray)保存圖片
plt.imsave(ndarray)
默認(rèn)保存到當(dāng)前路徑
plt.imsave('圖片名稱(chēng).png',圖片數(shù)據(jù),cmap='gray') #保存圖片 cmap:將圖片保存為黑白圖片
二、Pandas繪圖
1.繪制簡(jiǎn)單的線型圖
1.1)簡(jiǎn)單的Series圖表示例 .plot()
繪制正弦曲線
# 正弦曲線 x = np.linspace(0,2*np.pi,100) # 從0 到 2π 取100份 y = np.sin(x) # y 為sin(x) 的值 s = Series(data=y,index=x) # 構(gòu)建一個(gè)Series對(duì)象 s.plot() # 使用Series的plot()方法
1.2) 兩個(gè)Series繪制的曲線可以疊加
2)簡(jiǎn)單的DataFrame圖表示例 .plot()
繪制余弦曲線
x = np.linspace(0,2*np.pi,100) # 從0 到 2π 取100份 df = DataFrame(data={'sin':np.sin(x),'cos':np.cos(x)},index=x) #創(chuàng)建DataFrame對(duì)象 df.plot()
2.數(shù)據(jù)驅(qū)動(dòng)的線型圖(分析蘋(píng)果股票)
導(dǎo)包
import numpy as np import pandas as pd from pandas import Series,DataFrame
1.讀取數(shù)據(jù)
讀取文件AAPL.csv
df = pd.read_csv('./data/AAPL.csv') df.head()
2.檢查數(shù)據(jù)類(lèi)型
df.dtypes
Date object #時(shí)間的數(shù)據(jù)類(lèi)型為對(duì)象,在使用中需要做處理
Open float64
High float64
Low float64
Close float64
Adj Close float64
Volume float64
dtype: object
3.將’Date’這行數(shù)據(jù)轉(zhuǎn)換為時(shí)間數(shù)據(jù)類(lèi)型
pd.to_datetime(Series對(duì)象)
功能: 將Series轉(zhuǎn)換為時(shí)間數(shù)據(jù)類(lèi)型
df['Date'] # 這一列獲取出來(lái)是一個(gè)Series type(df['Date']) df['Date'] = pd.to_datetime(df['Date'])
df.dtypes
Date datetime64[ns] #此時(shí)已經(jīng)是時(shí)間類(lèi)型的數(shù)據(jù)了
Open float64
High float64
Low float64
Close float64
Adj Close float64
Volume float64
dtype: object
4.將’Date’設(shè)置為行索引
df.set_index('Date',inplace=True) ''' inplace:改變?cè)瓉?lái)的變量的值 '''
5.繪制圖形,以字段Adj Close(已調(diào)整收盤(pán)價(jià)格)為數(shù)據(jù)繪制
df['Adj Close'].plot()
3.繪制簡(jiǎn)單的柱狀圖
1) Series柱狀圖示例,kind = ‘bar’/’barh’
隨機(jī)產(chǎn)生5個(gè)數(shù),對(duì)其繪制縱向柱狀圖
''' data: 生成之后為Y軸的數(shù)據(jù) index: 生成之后為X軸的索引 ''' s = Series(data=np.random.randint(0,10,size=5),index=list('abcde')) #隨機(jī)產(chǎn)生5個(gè)數(shù) s.plot(kind='bar')
隨機(jī)產(chǎn)生5個(gè)數(shù),對(duì)其繪制橫向柱狀圖
''' data: 生成之后為Y軸的數(shù)據(jù) index: 生成之后為X軸的索引 ''' s = Series(data=np.random.randint(0,10,size=5),index=list('abcde')) s.plot(kind='barh')
2) DataFrame柱狀圖示例
隨機(jī)產(chǎn)生一個(gè)二維數(shù)組,并繪制縱向(kind=’bar’)柱狀圖
''' index: 生成數(shù)據(jù)X軸的索引 columns: 特征的名稱(chēng) ''' df = DataFrame(np.random.randint(0,10,size=(8,4)),index=list('abcdefgh'),columns=list('ABCD')) df.plot(kind='bar')
隨機(jī)產(chǎn)生一個(gè)二維數(shù)組,并繪制橫向(kind=’barh’)柱狀圖
4.繪制簡(jiǎn)單的直方圖
直方圖
直方圖(Histogram)又稱(chēng)質(zhì)量分布圖。是一種統(tǒng)計(jì)報(bào)告圖,由一系列高度不等的縱向條紋或線段表示數(shù)據(jù)分布的情況。 一般用橫軸表示數(shù)據(jù)類(lèi)型,縱軸表示分布情況。
s = Series(np.random.normal(loc=0,scale=5,size=10000)) # normal 正態(tài)分布 s.hist() #這里模擬出一組以0為中心,標(biāo)準(zhǔn)差為5的正態(tài)分布數(shù)據(jù), 繪制出的直方圖如下
5.繪制簡(jiǎn)單的核密度(“ked”)圖
核心密度估計(jì):對(duì)分布的圖進(jìn)行估計(jì)核心
我們繼續(xù)使用剛剛直方圖的 Series的正態(tài)分布數(shù)據(jù)
Series(np.random.normal(loc=0,scale=5,size=10000)) s.plot(kind='kde')
直方圖一般和核密度圖常常被畫(huà)在一起,既展示出頻率,又展示出了概率
有兩組數(shù)組,我們將這兩組數(shù)據(jù)連接成為一個(gè)。
分析這組新數(shù)據(jù)
ndarr1 = np.random.normal(loc=-10,scale=5,size=5000) #第一組數(shù)據(jù) ndarr2 = np.random.normal(loc=15,scale=2,size=5000) 第二組數(shù)據(jù) ndarr = np.concatenate([ndarr1,ndarr2]) #將兩組數(shù)據(jù)合為一組 s = Series(ndarr) #生成Series對(duì)象 s.plot(kind='kde') # 核心 密度 估計(jì) 用來(lái)展示某個(gè)位置出現(xiàn)內(nèi)容的概率的估計(jì)值 s.hist(density=True) # density表示直方圖也以 密度概率的值來(lái)展示 hist用來(lái)展示某個(gè)位置出現(xiàn)內(nèi)容的實(shí)際頻率 #展示效果如下
''' s.plot(kind='kde') 展示某個(gè)位置的估計(jì)值 s.hist(density=True) 表示某個(gè)位置出現(xiàn)內(nèi)容的實(shí)際頻率 '''
6.繪制簡(jiǎn)單的散點(diǎn)圖
散布圖是觀察兩個(gè)一維數(shù)據(jù)數(shù)列之間的關(guān)系的有效方法
示例數(shù)據(jù)
df = DataFrame(np.random.randint(0,150,size=(20,3)),columns=['python','math','eng']) df #模擬一個(gè)DataFrame數(shù)據(jù),列名為'python','math','eng' python math eng 0 141 41 55 1 37 76 96 2 61 28 135 。。。 17 124 103 83 18 86 47 44 19 35 85 85
將這組數(shù)據(jù)生成散點(diǎn)圖
df.plot(kind='scatter',x='python',y='eng') # kind = 'scatter' , 給明標(biāo)簽columns
這樣其實(shí)是沒(méi)有什么實(shí)際的意義的
現(xiàn)在我們?cè)偌右涣泻?ldquo;python”相關(guān)的數(shù)據(jù)
np.random.randint(-10,10,1)[0] # 0-10之間 隨機(jī)取一個(gè)數(shù) df['php'] = df['python'].map(lambda x: x*0.9+np.random.randint(-10,10,1)[0]) df python math eng php 0 121 67 15 113.9 1 148 33 149 123.2 。。。 18 79 77 108 74.1 19 105 107 53 102.5
我們從數(shù)據(jù)是很難看出來(lái)python和php有什么關(guān)系
這時(shí)我們就可以用散點(diǎn)圖來(lái)繪制出觀察
可以看出有python的值增大,php的值也會(huì)增大。
總結(jié)
到此這篇關(guān)于Python高級(jí)數(shù)據(jù)分析之pandas和matplotlib繪圖的文章就介紹到這了,更多相關(guān)Python pandas和matplotlib繪圖內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python實(shí)現(xiàn)批量備份交換機(jī)配置+自動(dòng)巡檢
這篇文章主要為大家詳細(xì)介紹了Python實(shí)現(xiàn)批量備份交換機(jī)配置+自動(dòng)巡檢的相關(guān)知識(shí),文中的示例代碼講解詳細(xì),感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下2023-11-11Python+OpenCV進(jìn)行不規(guī)則多邊形ROI區(qū)域提取
ROI即感興趣區(qū)域。機(jī)器視覺(jué)、圖像處理中,從被處理的圖像以方框、圓、橢圓、不規(guī)則多邊形等方式勾勒出需要處理的區(qū)域,稱(chēng)為感興趣區(qū)域,ROI。本文將利用Python和OpenCV實(shí)現(xiàn)不規(guī)則多邊形ROI區(qū)域提取,需要的可以參考一下2022-03-03python多進(jìn)程中的生產(chǎn)者和消費(fèi)者模型詳解
這篇文章主要介紹了python多進(jìn)程中的生產(chǎn)者和消費(fèi)者模型,生產(chǎn)者是指生產(chǎn)數(shù)據(jù)的任務(wù),消費(fèi)者是指消費(fèi)數(shù)據(jù)的任務(wù)。當(dāng)生產(chǎn)者的生產(chǎn)能力遠(yuǎn)大于消費(fèi)者的消費(fèi)能力,生產(chǎn)者就需要等消費(fèi)者消費(fèi)完才能繼續(xù)生產(chǎn)新的數(shù)據(jù)2023-03-03Python中的數(shù)據(jù)可視化matplotlib與繪圖庫(kù)模塊
這篇文章介紹了Python中的數(shù)據(jù)可視化matplotlib與繪圖庫(kù)模塊,文中通過(guò)示例代碼介紹的非常詳細(xì)。對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2022-05-05Django-Xadmin后臺(tái)首頁(yè)添加小組件報(bào)錯(cuò)的解決方案
這篇文章主要介紹了Django-Xadmin后臺(tái)首頁(yè)添加小組件報(bào)錯(cuò)的解決方案,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-08-08python 動(dòng)態(tài)加載的實(shí)現(xiàn)方法
腳本語(yǔ)言都有一個(gè)優(yōu)點(diǎn),就是動(dòng)態(tài)加載,python也有這個(gè)特性。這篇文章主要介紹了python 動(dòng)態(tài)加載的實(shí)現(xiàn)方法,需要的朋友可以參考下2017-12-12