一行代碼生成Tableau可視化圖表的方法
今天給大家介紹一個十分好用的Python模塊,用來給數(shù)據(jù)集做一個初步的探索性數(shù)據(jù)分析(EDA),有著類似Tableau的可視化界面,我們通過對于字段的拖拽就可以實現(xiàn)想要的可視化圖表,使用起來十分的簡單且容易上手,學(xué)習(xí)成本低,并且不需要我們寫一大推冗長的代碼。
PyGWalker
接下來就給大家來介紹一下這款名叫PyGWalker的Python模塊,在使用之前,我們先通過pip命令來將其下載安裝,代碼如下
pip install pygwalker ## 或者是 conda install pygwalker
我們將其與pandas模塊相結(jié)合,畢竟我們這里還是需要它來讀取CSV數(shù)據(jù)集的,這是一份共享單車的用戶使用數(shù)據(jù),代碼如下
import pandas as pd import pygwalker as pyg
模塊導(dǎo)入完成之后便是對數(shù)據(jù)集的讀取了,代碼如下
df = pd.read_csv(r"bike_sharing_dc.csv", parse_dates=['date']) df.head()
output
接下去便是PyGWalker該登場的時候了,代碼如下
pyg.walk(df)
output
我們隨后變回看到如上圖所示的界面,是不是和Tableau的界面很像呢,同樣在左邊的一欄中,我們可以看到數(shù)據(jù)集中各個字段,被分成了離散型變量(categorical data)和數(shù)值型變量(numeric data)
繪制可視化圖表
接下來我們嘗試來繪制可視化圖表,拖拽當中的字段放置到X軸或者Y軸當中,就會有可視化圖表顯示出來
那么我們可以嘗試繪制不同形態(tài)的圖標,例如我們想要繪制折線圖,例如我們在橫軸放置的是“hour”這個離散型變量,"registered"字段也就是注冊量作為縱軸,來查看不同時間段之下單車的使用量情況,同時在“Color”這一欄中放置的是“season”變量,代表的是不同的季節(jié)當中,不同時間段的單車App的注冊量情況
我們將圖表的形態(tài)變成區(qū)域圖,
同時我們還可以來更改圖表的大小,操作起來也十分的方便
過濾數(shù)據(jù)
這里我們還可以來過濾數(shù)據(jù),主要是在filter這一欄來進行操作,要是將離散型變量拖拽過去的話,可以指定篩選的條件是哪些,例如只查看“春天”和“夏天”這兩者的數(shù)據(jù),然后圖表依據(jù)篩選出來的條件來呈現(xiàn)最終的樣子
那么要是將數(shù)值型變量拖拽過去的話,會出來一個橫向的數(shù)軸并且設(shè)定橫軸的上下限,那么最終的圖表也會根據(jù)篩選出來的條件來呈現(xiàn)最終的樣子
查看原始數(shù)據(jù)
最后要是我們想要查看原始數(shù)據(jù),PyGWalker模塊也提供了非常方便的途徑,點擊當中的“Data”選項
到此這篇關(guān)于一行代碼生成Tableau可視化圖表的方法的文章就介紹到這了,更多相關(guān)Tableau可視化圖表內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python socket實現(xiàn)多對多全雙工通信的方法
今天小編就為大家分享一篇Python socket實現(xiàn)多對多全雙工通信的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-02-02Python使用pypinyin實現(xiàn)中文拼音轉(zhuǎn)換
pypinyin是一個Python庫,用于將中文漢字轉(zhuǎn)換為拼音,這篇文章主要為大家詳細介紹了pypinyin的基本用法并探討其應(yīng)用場景,需要的可以參考下2024-02-02Python-Tkinter Text輸入內(nèi)容在界面顯示的實例
今天小編就為大家分享一篇Python-Tkinter Text輸入內(nèi)容在界面顯示的實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-07-07