Matplotlib實戰(zhàn)之折線圖繪制詳解
折線圖是一種用于可視化數(shù)據(jù)變化趨勢的圖表,它可以用于表示任何數(shù)值隨著時間或類別的變化。
折線圖由折線段和折線交點組成,折線段表示數(shù)值隨時間或類別的變化趨勢,折線交點表示數(shù)據(jù)的轉折點。
折線圖的方向表示數(shù)據(jù)的變化方向,即正變化還是負變化,折線的斜率表示數(shù)據(jù)的變化程度。
1. 主要元素
折線圖主要由以下四個元素組成:
- 數(shù)據(jù)點:折線圖中的每個數(shù)據(jù)點都代表著一個時間點或一個數(shù)值。
- 折線:折線圖中的線條代表著數(shù)據(jù)的變化趨勢。
- X軸:一般是有序變量,表示數(shù)據(jù)點的變化區(qū)間。
- Y軸:數(shù)據(jù)點在不同時刻的值。
2. 適用的場景
折線圖適用于以下分析場景:
- 趨勢分析:折線圖可以用于展示數(shù)據(jù)的增長、下降、波動等趨勢,幫助分析人員了解數(shù)據(jù)的變化趨勢。
- 問題診斷:折線圖可以用于數(shù)據(jù)異常檢測,幫助分析人員快速發(fā)現(xiàn)數(shù)據(jù)的異常情況。
3. 不適用的場景
折線圖不適用于以下分析場景:
- 數(shù)據(jù)分類和分組:折線圖不適用于數(shù)據(jù)分類和分組分析,因為折線圖主要用于展示數(shù)據(jù)的變化趨勢,而不是數(shù)據(jù)的分類和分組情況。
- 數(shù)據(jù)回歸分析:折線圖不適用于數(shù)據(jù)回歸分析,因為回歸分析需要建立在數(shù)據(jù)樣本中的線性關系,而折線圖主要用于展示數(shù)據(jù)的變化趨勢,不能很好地反映數(shù)據(jù)的線性關系。
4. 分析實戰(zhàn)
4.1. 數(shù)據(jù)來源
數(shù)據(jù)來源國家統(tǒng)計局公開數(shù)據(jù),已經整理好的csv文件在:databook.top/nation/A03
本次分析使用其中的 A0301.csv
文件(總人口數(shù)據(jù))。
下面的文件路徑 fp
要換成自己實際的文件路徑。
import pandas as pd fp = "d:/share/A0301.csv" df = pd.read_csv(fp) df
4.2. 數(shù)據(jù)清理
首先看看 zbCN
字段中有多少種不同的人口統(tǒng)計類別。
df.groupby(by="zbCN").count()
這個數(shù)據(jù)集中一共有5種不同維度的人口統(tǒng)計:
- 年末總人口
- 男性人口
- 女性人口
- 城鎮(zhèn)人口
- 鄉(xiāng)村人口
按照類別,將它們分離成5個不同的數(shù)據(jù)集,為了繪制折線圖做準備。
groups = df.groupby(by="zbCN") dict_group = {} for g in groups: dict_group[g[0]] = g[1] for k, v in dict_group.items(): print("key = {}, value type = {}".format(k, type(v)))
groupby
函數(shù)按照 by
參數(shù)指定的字段將數(shù)據(jù)集分組,每個group
是一個二元的元組。
第一個元素是用來分組的字段值,第二個元素是分組之后的數(shù)據(jù)集。
4.3. 分析結果可視化
拆分好數(shù)據(jù)集之后,最就是可視化展示。
首先封裝一個函數(shù),用來顯示2個數(shù)據(jù):(直接使用上面分割好的數(shù)據(jù)集dict_group
)
import pandas as pd import matplotlib import matplotlib.pyplot as plt from matplotlib.ticker import MultipleLocator %matplotlib inline #為了顯示中文 matplotlib.rcParams["font.sans-serif"] = ["Microsoft YaHei Mono"] matplotlib.rcParams["axes.unicode_minus"] = False #根據(jù)key顯示兩個數(shù)據(jù)集 def draw(key1, key2): with plt.style.context("seaborn-v0_8"): fig = plt.figure() ax = fig.add_axes([0.1, 0.1, 0.8, 0.8]) ax.xaxis.set_major_locator(MultipleLocator(4)) ax.xaxis.set_minor_locator(MultipleLocator(2)) data = dict_group[key1] ax.plot(data["sjCN"], data["value"], "b--o", label=key1) data = dict_group[key2] ax.plot(data["sjCN"], data["value"], "g:d", label=key2) ax.legend()
首先看下男女人口的變化趨勢:
key1 = "女性人口(萬人)" key2 = "男性人口(萬人)" #男性人口和女性人口的變化趨勢 dict_group[key1] = dict_group[key1].sort_values("sj") dict_group[key2] = dict_group[key2].sort_values("sj") draw(key1, key2)
看這個趨勢變化,男女人口的差距長期都在幾千萬上下,所以找不到女朋友也許不是你的責任 : )
再看看城鎮(zhèn)和鄉(xiāng)村的人口變化。
key1 = "鄉(xiāng)村人口(萬人)" key2 = "城鎮(zhèn)人口(萬人)" #鄉(xiāng)村人口和城鎮(zhèn)人口的變化趨勢 dict_group[key1] = dict_group[key1].sort_values("sj") dict_group[key2] = dict_group[key2].sort_values("sj") draw(key1, key2)
從圖中可以看出,1994年左右,鄉(xiāng)村人口開始進入城鎮(zhèn);
2010年左右,城鎮(zhèn)人口開始超越鄉(xiāng)村人口,且人口差距越來越大。
折線圖最適合的場景就是展示這類有趨勢變化的數(shù)據(jù)。
到此這篇關于Matplotlib實戰(zhàn)之折線圖繪制詳解的文章就介紹到這了,更多相關Matplotlib折線圖內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
在django中實現(xiàn)choices字段獲取對應字段值
這篇文章主要介紹了在django中實現(xiàn)choices字段獲取對應字段值,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-07-07Python 中數(shù)組和數(shù)字相乘時的注意事項說明
這篇文章主要介紹了Python 中數(shù)組和數(shù)字相乘時的注意事項說明,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2021-05-05windows下wxPython開發(fā)環(huán)境安裝與配置方法
這篇文章主要介紹了windows下wxPython開發(fā)環(huán)境安裝與配置方法,需要的朋友可以參考下2014-06-06淺談Python里面None True False之間的區(qū)別
這篇文章主要介紹了淺談Python里面None True False之間的區(qū)別,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-07-07