Python可視化模塊altair的使用詳解
今天小編來和大家聊一下Python
當中的altair
可視化模塊,并且通過調用該模塊來繪制一些常見的圖表,借助Altair,我們可以將更多的精力和時間放在理解數(shù)據(jù)本身以及數(shù)據(jù)的意義上面,從復雜的數(shù)據(jù)可視化過程中解脫出來。
Altair是啥
Altair被稱為是統(tǒng)計可視化庫,因為它可以通過分類匯總、數(shù)據(jù)變換、數(shù)據(jù)交互、圖形復合等方式全面地認識數(shù)據(jù)、理解和分析數(shù)據(jù),并且其安裝的過程也是十分的簡單,直接通過pip
命令來執(zhí)行,如下
pip install altair pip install vega_datasets pip install altair_viewer
如果使用的是conda包管理器來安裝Altair模塊的話,代碼如下
conda?install?-c?conda-forge?altair?vega_datasets
Altair初體驗
我們先簡單地來嘗試繪制一個直方圖,首先創(chuàng)建一個DataFrame
數(shù)據(jù)集,代碼如下
df = pd.DataFrame({"brand":["iPhone","Xiaomi","HuaWei","Vivo"], "profit(B)":[200,55,88,60]})
接下來便是繪制直方圖的代碼
import altair as alt import pandas as pd import altair_viewer chart = alt.Chart(df).mark_bar().encode(x="brand:N",y="profit(B):Q") # 展示數(shù)據(jù),調用display()方法 altair_viewer.display(chart,inline=True)
output
從整個的語法結構來看,首先使用alt.Chart()
指定使用的數(shù)據(jù)集,然后使用實例方法mark_*()
繪圖圖表的樣式,最后指定X軸和Y軸所代表的數(shù)據(jù),可能大家會感到好奇,當中的N
以及Q
分別代表的是什么,這個是變量類型的縮寫形式,換句話說,Altair
模塊需要了解繪制圖形所涉及的變量類型,只有這樣,繪制的圖形才是我們期望的效果。
其中的N
代表的是名義型的變量(Nominal
),例如手機的品牌都是一個個專有名詞,而Q
代表的是數(shù)值型變量(Quantitative
),可以分為離散型數(shù)據(jù)(discrete
)和連續(xù)型數(shù)據(jù)(continuous
),除此之外還有時間序列型數(shù)據(jù),縮寫是T
以及次序型變量(O
),例如在網購過程當中的對商家的評級有1-5個星級。
圖表的保存
最后的圖表的保存,我們可以直接調用save()
方法來保存,將對象保存成HTML
文件,代碼如下
chart.save("chart.html")
也可以保存成JSON
文件,從代碼上來看十分的相類似
chart.save("chart.json")
當然我們也能夠保存成圖片格式的文件,如下圖所示
Altair之進階操作
我們在上面的基礎之上,進一步的衍生和拓展,例如我們想要繪制一張水平方向的條形圖,X
軸和Y
軸的數(shù)據(jù)互換,代碼如下
chart = alt.Chart(df).mark_bar().encode(x="profit(B):Q", y="brand:N") chart.save("chart1.html")
output
同時我們也來嘗試繪制一張折線圖,調用的是mark_line()
方法代碼如下
## 創(chuàng)建一組新的數(shù)據(jù),以日期為行索引值 np.random.seed(29) value = np.random.randn(365) data = np.cumsum(value) date = pd.date_range(start="20220101", end="20221231") df = pd.DataFrame({"num": data}, index=date) line_chart = alt.Chart(df.reset_index()).mark_line().encode(x="index:T", y="num:Q") line_chart.save("chart2.html")
output
我們還可以來繪制一張甘特圖,通常在項目管理上面用到的比較多,X
軸添加的是時間日期,而Y
軸上表示的則是項目的進展,代碼如下
project = [{"project": "Proj1", "start_time": "2022-01-16", "end_time": "2022-03-20"}, {"project": "Proj2", "start_time": "2022-04-12", "end_time": "2022-11-20"}, ...... ] df = alt.Data(values=project) chart = alt.Chart(df).mark_bar().encode( alt.X("start_time:T", axis=alt.Axis(format="%x", formatType="time", tickCount=3), scale=alt.Scale(domain=[alt.DateTime(year=2022, month=1, date=1), alt.DateTime(year=2022, month=12, date=1)])), alt.X2("end_time:T"), alt.Y("project:N", axis=alt.Axis(labelAlign="left", labelFontSize=15, labelOffset=0, labelPadding=50)), color=alt.Color("project:N", legend=alt.Legend(labelFontSize=12, symbolOpacity=0.7, titleFontSize=15))) chart.save("chart_gantt.html")
output
從上圖中我們看到團隊當中正在做的幾個項目,每個項目的進展程度不同,當然了,不同項目的時間跨度也不盡相同,表現(xiàn)在圖表上面的話就顯得十分的直觀了。
緊接著,我們再來繪制散點圖,調用的是mark_circle()
方法,代碼如下
df = data.cars() ## 篩選出地區(qū)是“USA”也就是美國的乘用車數(shù)據(jù) df_1 = alt.Chart(df).transform_filter( alt.datum.Origin == "USA" ) df = data.cars() df_1 = alt.Chart(df).transform_filter( alt.datum.Origin == "USA" ) chart = df_1.mark_circle().encode( alt.X("Horsepower:Q"), alt.Y("Miles_per_Gallon:Q") ) chart.save("chart_dots.html")
output
當然我們可以將其進一步的優(yōu)化,讓圖表顯得更加美觀一些,添加一些顏色上去,代碼如下
chart = df_1.mark_circle(color=alt.RadialGradient("radial",[alt.GradientStop("white", 0.0), alt.GradientStop("red", 1.0)]), size=160).encode( alt.X("Horsepower:Q", scale=alt.Scale(zero=False,padding=20)), alt.Y("Miles_per_Gallon:Q", scale=alt.Scale(zero=False,padding=20)) )
output
我們更改散點的大小,不同散點的大小代表著不同的值,代碼如下
chart = df_1.mark_circle(color=alt.RadialGradient("radial",[alt.GradientStop("white", 0.0), alt.GradientStop("red", 1.0)]), size=160).encode( alt.X("Horsepower:Q", scale=alt.Scale(zero=False, padding=20)), alt.Y("Miles_per_Gallon:Q", scale=alt.Scale(zero=False, padding=20)), size="Acceleration:Q" )
output
以上就是Python可視化模塊altair的使用詳解的詳細內容,更多關于Python可視化模塊altair的資料請關注腳本之家其它相關文章!
相關文章
python使用urllib模塊開發(fā)的多線程豆瓣小站mp3下載器
對豆瓣音樂小站頁面html分析出所有mp3(正則匹配)文件url,然后用urllib.urlretrieve中方法直接將文件下載到本地,通過多線程技術下載2014-01-01Django在Win7下的安裝及創(chuàng)建項目hello word簡明教程
這篇文章主要介紹了Django在Win7下的安裝及創(chuàng)建項目hello word,需要的朋友可以參考下2014-07-07