Python可視化模塊altair的使用詳解
今天小編來(lái)和大家聊一下Python當(dāng)中的altair可視化模塊,并且通過(guò)調(diào)用該模塊來(lái)繪制一些常見(jiàn)的圖表,借助Altair,我們可以將更多的精力和時(shí)間放在理解數(shù)據(jù)本身以及數(shù)據(jù)的意義上面,從復(fù)雜的數(shù)據(jù)可視化過(guò)程中解脫出來(lái)。
Altair是啥
Altair被稱為是統(tǒng)計(jì)可視化庫(kù),因?yàn)樗梢酝ㄟ^(guò)分類匯總、數(shù)據(jù)變換、數(shù)據(jù)交互、圖形復(fù)合等方式全面地認(rèn)識(shí)數(shù)據(jù)、理解和分析數(shù)據(jù),并且其安裝的過(guò)程也是十分的簡(jiǎn)單,直接通過(guò)pip命令來(lái)執(zhí)行,如下
pip install altair pip install vega_datasets pip install altair_viewer
如果使用的是conda包管理器來(lái)安裝Altair模塊的話,代碼如下
conda?install?-c?conda-forge?altair?vega_datasets
Altair初體驗(yàn)
我們先簡(jiǎn)單地來(lái)嘗試?yán)L制一個(gè)直方圖,首先創(chuàng)建一個(gè)DataFrame數(shù)據(jù)集,代碼如下
df = pd.DataFrame({"brand":["iPhone","Xiaomi","HuaWei","Vivo"],
"profit(B)":[200,55,88,60]})接下來(lái)便是繪制直方圖的代碼
import altair as alt import pandas as pd import altair_viewer chart = alt.Chart(df).mark_bar().encode(x="brand:N",y="profit(B):Q") # 展示數(shù)據(jù),調(diào)用display()方法 altair_viewer.display(chart,inline=True)
output

從整個(gè)的語(yǔ)法結(jié)構(gòu)來(lái)看,首先使用alt.Chart()指定使用的數(shù)據(jù)集,然后使用實(shí)例方法mark_*()繪圖圖表的樣式,最后指定X軸和Y軸所代表的數(shù)據(jù),可能大家會(huì)感到好奇,當(dāng)中的N以及Q分別代表的是什么,這個(gè)是變量類型的縮寫形式,換句話說(shuō),Altair模塊需要了解繪制圖形所涉及的變量類型,只有這樣,繪制的圖形才是我們期望的效果。
其中的N代表的是名義型的變量(Nominal),例如手機(jī)的品牌都是一個(gè)個(gè)專有名詞,而Q代表的是數(shù)值型變量(Quantitative),可以分為離散型數(shù)據(jù)(discrete)和連續(xù)型數(shù)據(jù)(continuous),除此之外還有時(shí)間序列型數(shù)據(jù),縮寫是T以及次序型變量(O),例如在網(wǎng)購(gòu)過(guò)程當(dāng)中的對(duì)商家的評(píng)級(jí)有1-5個(gè)星級(jí)。
圖表的保存
最后的圖表的保存,我們可以直接調(diào)用save()方法來(lái)保存,將對(duì)象保存成HTML文件,代碼如下
chart.save("chart.html")
也可以保存成JSON文件,從代碼上來(lái)看十分的相類似
chart.save("chart.json")
當(dāng)然我們也能夠保存成圖片格式的文件,如下圖所示

Altair之進(jìn)階操作
我們?cè)谏厦娴幕A(chǔ)之上,進(jìn)一步的衍生和拓展,例如我們想要繪制一張水平方向的條形圖,X軸和Y軸的數(shù)據(jù)互換,代碼如下
chart = alt.Chart(df).mark_bar().encode(x="profit(B):Q", y="brand:N")
chart.save("chart1.html")output

同時(shí)我們也來(lái)嘗試?yán)L制一張折線圖,調(diào)用的是mark_line()方法代碼如下
## 創(chuàng)建一組新的數(shù)據(jù),以日期為行索引值
np.random.seed(29)
value = np.random.randn(365)
data = np.cumsum(value)
date = pd.date_range(start="20220101", end="20221231")
df = pd.DataFrame({"num": data}, index=date)
line_chart = alt.Chart(df.reset_index()).mark_line().encode(x="index:T", y="num:Q")
line_chart.save("chart2.html")output

我們還可以來(lái)繪制一張甘特圖,通常在項(xiàng)目管理上面用到的比較多,X軸添加的是時(shí)間日期,而Y軸上表示的則是項(xiàng)目的進(jìn)展,代碼如下
project = [{"project": "Proj1", "start_time": "2022-01-16", "end_time": "2022-03-20"},
{"project": "Proj2", "start_time": "2022-04-12", "end_time": "2022-11-20"},
......
]
df = alt.Data(values=project)
chart = alt.Chart(df).mark_bar().encode(
alt.X("start_time:T",
axis=alt.Axis(format="%x",
formatType="time",
tickCount=3),
scale=alt.Scale(domain=[alt.DateTime(year=2022, month=1, date=1),
alt.DateTime(year=2022, month=12, date=1)])),
alt.X2("end_time:T"),
alt.Y("project:N", axis=alt.Axis(labelAlign="left",
labelFontSize=15,
labelOffset=0,
labelPadding=50)),
color=alt.Color("project:N", legend=alt.Legend(labelFontSize=12,
symbolOpacity=0.7,
titleFontSize=15)))
chart.save("chart_gantt.html")output

從上圖中我們看到團(tuán)隊(duì)當(dāng)中正在做的幾個(gè)項(xiàng)目,每個(gè)項(xiàng)目的進(jìn)展程度不同,當(dāng)然了,不同項(xiàng)目的時(shí)間跨度也不盡相同,表現(xiàn)在圖表上面的話就顯得十分的直觀了。
緊接著,我們?cè)賮?lái)繪制散點(diǎn)圖,調(diào)用的是mark_circle()方法,代碼如下
df = data.cars()
## 篩選出地區(qū)是“USA”也就是美國(guó)的乘用車數(shù)據(jù)
df_1 = alt.Chart(df).transform_filter(
alt.datum.Origin == "USA"
)
df = data.cars()
df_1 = alt.Chart(df).transform_filter(
alt.datum.Origin == "USA"
)
chart = df_1.mark_circle().encode(
alt.X("Horsepower:Q"),
alt.Y("Miles_per_Gallon:Q")
)
chart.save("chart_dots.html")output

當(dāng)然我們可以將其進(jìn)一步的優(yōu)化,讓圖表顯得更加美觀一些,添加一些顏色上去,代碼如下
chart = df_1.mark_circle(color=alt.RadialGradient("radial",[alt.GradientStop("white", 0.0),
alt.GradientStop("red", 1.0)]),
size=160).encode(
alt.X("Horsepower:Q", scale=alt.Scale(zero=False,padding=20)),
alt.Y("Miles_per_Gallon:Q", scale=alt.Scale(zero=False,padding=20))
)output

我們更改散點(diǎn)的大小,不同散點(diǎn)的大小代表著不同的值,代碼如下
chart = df_1.mark_circle(color=alt.RadialGradient("radial",[alt.GradientStop("white", 0.0),
alt.GradientStop("red", 1.0)]),
size=160).encode(
alt.X("Horsepower:Q", scale=alt.Scale(zero=False, padding=20)),
alt.Y("Miles_per_Gallon:Q", scale=alt.Scale(zero=False, padding=20)),
size="Acceleration:Q"
)output

以上就是Python可視化模塊altair的使用詳解的詳細(xì)內(nèi)容,更多關(guān)于Python可視化模塊altair的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
Python對(duì)切片命名的實(shí)現(xiàn)方法
在本篇文章里我們給大家分享了關(guān)于Python對(duì)切片命名的實(shí)現(xiàn)方法的相關(guān)知識(shí)點(diǎn)內(nèi)容,有需要的朋友們學(xué)習(xí)下。2018-10-10
python使用urllib模塊開(kāi)發(fā)的多線程豆瓣小站mp3下載器
對(duì)豆瓣音樂(lè)小站頁(yè)面html分析出所有mp3(正則匹配)文件url,然后用urllib.urlretrieve中方法直接將文件下載到本地,通過(guò)多線程技術(shù)下載2014-01-01
pycharm使用技巧之自動(dòng)調(diào)整代碼格式總結(jié)
這篇文章主要給大家介紹了關(guān)于pycharm使用技巧之自動(dòng)調(diào)整代碼格式總結(jié)的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2020-11-11
Django在Win7下的安裝及創(chuàng)建項(xiàng)目hello word簡(jiǎn)明教程
這篇文章主要介紹了Django在Win7下的安裝及創(chuàng)建項(xiàng)目hello word,需要的朋友可以參考下2014-07-07
TensorFlow固化模型的實(shí)現(xiàn)操作
這篇文章主要介紹了TensorFlow固化模型的實(shí)現(xiàn)操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-05-05
Python設(shè)計(jì)模式結(jié)構(gòu)型組合模式
這篇文章主要介紹了Python設(shè)計(jì)模式結(jié)構(gòu)型組合模式,組合模式即Composite?Pattern,將對(duì)象組合成成樹(shù)形結(jié)構(gòu)以表示“部分-整體”的層次結(jié)構(gòu),組合模式使得用戶對(duì)單個(gè)對(duì)象和組合對(duì)象的使用具有一致性,下文具有一定的參考價(jià)值,需要的小伙伴可以參考一下2022-02-02
Python標(biāo)準(zhǔn)庫(kù)之sqlite3使用實(shí)例
這篇文章主要介紹了Python標(biāo)準(zhǔn)庫(kù)之sqlite3使用實(shí)例,本文講解了創(chuàng)建數(shù)據(jù)庫(kù)、插入數(shù)據(jù)、查詢數(shù)據(jù)、更新與刪除數(shù)據(jù)操作實(shí)例,需要的朋友可以參考下2014-11-11

