欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

利用Python繪制數(shù)據(jù)的瀑布圖的教程

 更新時(shí)間:2015年04月07日 09:16:37   作者:Chris Moffitt  
這篇文章主要介紹了利用Python繪制數(shù)據(jù)的瀑布圖的教程,教程中主要用到Pandas和matplotlib這兩個(gè)庫(kù),需要的朋友可以參考下

介紹

對(duì)于繪制某些類型的數(shù)據(jù)來說,瀑布圖是一種十分有用的工具。不足為奇的是,我們可以使用Pandas和matplotlib創(chuàng)建一個(gè)可重復(fù)的瀑布圖。

在往下進(jìn)行之前,我想先告訴大家我指代的是哪種類型的圖表。我將建立一個(gè)維基百科文章中描述的2D瀑布圖。

這種圖表的一個(gè)典型的用處是顯示開始值和結(jié)束值之間起“橋梁”作用的+和-的值。因?yàn)檫@個(gè)原因,財(cái)務(wù)人員有時(shí)會(huì)將其稱為一個(gè)橋梁。跟我之前所采用的其他例子相似,這種類型的繪圖在Excel中不容易生成,當(dāng)然肯定有生成它的方法,但是不容易記住。

關(guān)于瀑布圖需要記住的關(guān)鍵點(diǎn)是:它本質(zhì)上是一個(gè)堆疊在一起的條形圖,不過特殊的一點(diǎn)是,它有一個(gè)空白底欄,所以頂部欄會(huì)“懸浮”在空中。那么,讓我們開始吧。
創(chuàng)建圖表

首先,執(zhí)行標(biāo)準(zhǔn)的輸入,并確保IPython能顯示matplot圖。
 

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
 
%matplotlib inline

設(shè)置我們想畫出瀑布圖的數(shù)據(jù),并將其加載到數(shù)據(jù)幀(DataFrame)中。

數(shù)據(jù)需要以你的起始值開始,但是你需要給出最終的總數(shù)。我們將在下面計(jì)算它。
 

index = ['sales','returns','credit fees','rebates','late charges','shipping']
data = {'amount': [350000,-30000,-7500,-25000,95000,-7000]}
trans = pd.DataFrame(data=data,index=index)

我使用了IPython中便捷的display函數(shù)來更簡(jiǎn)單地控制我要顯示的內(nèi)容。
 

from IPython.display import display
display(trans)

20154790658991.jpg (291×347)

瀑布圖的最大技巧是計(jì)算出底部堆疊條形圖的內(nèi)容。有關(guān)這一點(diǎn),我從stackoverflow上的討論中學(xué)到很多。

首先,我們得到累積和。
 

display(trans.amount.cumsum())
sales      350000
returns     320000
credit fees   312500
rebates     287500
late charges  382500
shipping    375500
Name: amount, dtype: int64

這看起來不錯(cuò),但我們需要將一個(gè)地方的數(shù)據(jù)轉(zhuǎn)移到右邊。
 

blank=trans.amount.cumsum().shift(1).fillna(0)
display(blank)
 
sales        0
returns     350000
credit fees   320000
rebates     312500
late charges  287500
shipping    382500
Name: amount, dtype: float64

我們需要向trans和blank數(shù)據(jù)幀中添加一個(gè)凈總量。
 

total = trans.sum().amount
trans.loc["net"] = total
blank.loc["net"] = total
display(trans)
display(blank)

20154790750136.jpg (275×390)

sales        0
returns     350000
credit fees   320000
rebates     312500
late charges  287500
shipping    382500
net       375500
Name: amount, dtype: float64

創(chuàng)建我們用來顯示變化的步驟。

step = blank.reset_index(drop=True).repeat(3).shift(-1)
step[1::3] = np.nan
display(step)
 
0     0
0    NaN
0  350000
1  350000
1    NaN
1  320000
2  320000
2    NaN
2  312500
3  312500
3    NaN
3  287500
4  287500
4    NaN
4  382500
5  382500
5    NaN
5  375500
6  375500
6    NaN
6    NaN
Name: amount, dtype: float64

對(duì)于“net”行,為了不使堆疊加倍,我們需要確保blank值為0。
 

blank.loc["net"] = 0

然后,將其畫圖,看一下什么樣子。
 

my_plot = trans.plot(kind='bar', stacked=True, bottom=blank,legend=None, title="2014 Sales Waterfall")
my_plot.plot(step.index, step.values,'k')

20154790839916.jpg (391×317)

看起來相當(dāng)不錯(cuò),但是讓我們?cè)囍袷交痀軸,以使其更具有可讀性。為此,我們使用FuncFormatter和一些Python2.7+的語(yǔ)法來截?cái)嘈?shù)并向格式中添加一個(gè)逗號(hào)。
 

def money(x, pos):
  'The two args are the value and tick position'
  return "${:,.0f}".format(x)
 
from matplotlib.ticker import FuncFormatter
formatter = FuncFormatter(money)

然后,將其組合在一起。
 

my_plot = trans.plot(kind='bar', stacked=True, bottom=blank,legend=None, title="2014 Sales Waterfall")
my_plot.plot(step.index, step.values,'k')
my_plot.set_xlabel("Transaction Types")
my_plot.yaxis.set_major_formatter(formatter)

20154790915888.jpg (399×332)

完整腳本

基本圖形能夠正常工作,但是我想添加一些標(biāo)簽,并做一些小的格式修改。下面是我最終的腳本:
 

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from matplotlib.ticker import FuncFormatter
 
#Use python 2.7+ syntax to format currency
def money(x, pos):
  'The two args are the value and tick position'
  return "${:,.0f}".format(x)
formatter = FuncFormatter(money)
 
#Data to plot. Do not include a total, it will be calculated
index = ['sales','returns','credit fees','rebates','late charges','shipping']
data = {'amount': [350000,-30000,-7500,-25000,95000,-7000]}
 
#Store data and create a blank series to use for the waterfall
trans = pd.DataFrame(data=data,index=index)
blank = trans.amount.cumsum().shift(1).fillna(0)
 
#Get the net total number for the final element in the waterfall
total = trans.sum().amount
trans.loc["net"]= total
blank.loc["net"] = total
 
#The steps graphically show the levels as well as used for label placement
step = blank.reset_index(drop=True).repeat(3).shift(-1)
step[1::3] = np.nan
 
#When plotting the last element, we want to show the full bar,
#Set the blank to 0
blank.loc["net"] = 0
 
#Plot and label
my_plot = trans.plot(kind='bar', stacked=True, bottom=blank,legend=None, figsize=(10, 5), title="2014 Sales Waterfall")
my_plot.plot(step.index, step.values,'k')
my_plot.set_xlabel("Transaction Types")
 
#Format the axis for dollars
my_plot.yaxis.set_major_formatter(formatter)
 
#Get the y-axis position for the labels
y_height = trans.amount.cumsum().shift(1).fillna(0)
 
#Get an offset so labels don't sit right on top of the bar
max = trans.max()
neg_offset = max / 25
pos_offset = max / 50
plot_offset = int(max / 15)
 
#Start label loop
loop = 0
for index, row in trans.iterrows():
  # For the last item in the list, we don't want to double count
  if row['amount'] == total:
    y = y_height[loop]
  else:
    y = y_height[loop] + row['amount']
  # Determine if we want a neg or pos offset
  if row['amount'] > 0:
    y += pos_offset
  else:
    y -= neg_offset
  my_plot.annotate("{:,.0f}".format(row['amount']),(loop,y),ha="center")
  loop+=1
 
#Scale up the y axis so there is room for the labels
my_plot.set_ylim(0,blank.max()+int(plot_offset))
#Rotate the labels
my_plot.set_xticklabels(trans.index,rotation=0)
my_plot.get_figure().savefig("waterfall.png",dpi=200,bbox_inches='tight')

運(yùn)行該腳本將生成下面這個(gè)漂亮的圖表:

20154790943979.jpg (650×361)

最后的想法

如果你之前不熟悉瀑布圖,希望這個(gè)示例能夠向你展示它到底是多么有用。我想,可能一些人會(huì)覺得對(duì)于一個(gè)圖表來說需要這么多的腳本代碼有點(diǎn)糟糕。在某些方面,我同意這種想法。如果你僅僅只是做一個(gè)瀑布圖,而以后不會(huì)再碰它,那么你還是繼續(xù)用Excel中的方法吧。

然而,如果瀑布圖真的很有用,并且你需要將它復(fù)制給100個(gè)客戶,將會(huì)怎么樣呢?接下來你將要怎么做呢?此時(shí)使用Excel將會(huì)是一個(gè)挑戰(zhàn),而使用本文中的腳本來創(chuàng)建100個(gè)不同的表格將相當(dāng)容易。再次說明,這一程序的真正價(jià)值在于,當(dāng)你需要擴(kuò)展這個(gè)解決方案時(shí),它能夠便于你創(chuàng)建一個(gè)易于復(fù)制的程序。

我真的很喜歡學(xué)習(xí)更多Pandas、matplotlib和IPothon的知識(shí)。我很高興這種方法能夠幫到你,并希望其他人也可以從中學(xué)習(xí)到一些知識(shí),并將這一課所學(xué)應(yīng)用到他們的日常工作中。

相關(guān)文章

  • 我就是這樣學(xué)習(xí)Python中的列表

    我就是這樣學(xué)習(xí)Python中的列表

    這篇文章主要給大家介紹了關(guān)于我是如何學(xué)習(xí)Python中的列表的,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家學(xué)習(xí)或者使用Python具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-06-06
  • python3讀取autocad圖形文件.py實(shí)例

    python3讀取autocad圖形文件.py實(shí)例

    這篇文章主要介紹了python3讀取autocad圖形文件.py實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
    2020-06-06
  • python實(shí)現(xiàn)的文件夾清理程序分享

    python實(shí)現(xiàn)的文件夾清理程序分享

    這篇文章主要介紹了python實(shí)現(xiàn)的文件夾清理程序分享,可以按時(shí)間清理和指定配置文件清理,需要的朋友可以參考下
    2014-11-11
  • Tensorflow深度學(xué)習(xí)使用CNN分類英文文本

    Tensorflow深度學(xué)習(xí)使用CNN分類英文文本

    這篇文章主要為大家介紹了Tensorflow深度學(xué)習(xí)CNN實(shí)現(xiàn)英文文本分類示例解析,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步
    2021-11-11
  • python掌握字符串只需這一篇就夠了

    python掌握字符串只需這一篇就夠了

    字符串是 Python 中最常用的數(shù)據(jù)類型。我們可以使用引號(hào)('或")來創(chuàng)建字符串。創(chuàng)建字符串很簡(jiǎn)單,只要為變量分配一個(gè)值即可
    2021-11-11
  • Python自定義模塊的創(chuàng)建與使用

    Python自定義模塊的創(chuàng)建與使用

    這篇文章主要給大家介紹了關(guān)于Python自定義模塊創(chuàng)建與使用的相關(guān)資料,文中還給大家分享了python打包用戶自定義模塊的方法,文中通過實(shí)例代碼介紹的非常詳細(xì),需要的朋友可以參考下
    2022-05-05
  • Python實(shí)現(xiàn)自動(dòng)化整理文件的示例代碼

    Python實(shí)現(xiàn)自動(dòng)化整理文件的示例代碼

    這篇文章主要介紹了如何通過Python編程完成文件的自動(dòng)分類、文件和文件夾的快速查找、重復(fù)文件的清理、圖片格式的轉(zhuǎn)換等常見工作,需要的可以參考一下
    2022-09-09
  • python如何通過protobuf實(shí)現(xiàn)rpc

    python如何通過protobuf實(shí)現(xiàn)rpc

    這篇文章主要為大家詳細(xì)介紹了python通過protobuf實(shí)現(xiàn)rpc的方法,感興趣的朋友可以參考一下
    2016-03-03
  • Python的Django框架中的Context使用

    Python的Django框架中的Context使用

    這篇文章主要介紹了Python的Django框架中的Context使用,相關(guān)的渲染是Django中創(chuàng)建模版的關(guān)鍵,需要的朋友可以參考下
    2015-07-07
  • Python sys.path詳細(xì)介紹

    Python sys.path詳細(xì)介紹

    這篇文章詳細(xì)介紹了Python sys.path,有需要的朋友可以參考一下
    2013-10-10

最新評(píng)論