在Python中調(diào)用ggplot的三種方法
本文提供了三種不同的方式在Python(IPython Notebook)中調(diào)用ggplot。
在大數(shù)據(jù)時(shí)代,數(shù)據(jù)可視化是一個(gè)非常熱門的話題。各個(gè)BI的廠商無(wú)不在數(shù)據(jù)可視化領(lǐng)域里投入大量的精力。Tableau憑借其強(qiáng)大的數(shù)據(jù)可視化的功能成為硅谷炙手可熱的上市公司。Tableau的數(shù)據(jù)可視化的產(chǎn)品,其理論基礎(chǔ)其實(shí)是《The Grammar of Graphic》,該書提出了對(duì)信息可視化的圖表的語(yǔ)法抽象體系,數(shù)據(jù)的探索和分析可以由圖像的語(yǔ)法來(lái)驅(qū)動(dòng),而非有固定的圖表類型來(lái)驅(qū)動(dòng),使得數(shù)據(jù)的探索過(guò)程變得友好而有趣。
然而對(duì)于The Grammar of Graphic的理論的實(shí)踐,并非Tableau獨(dú)占,ggplot作為R語(yǔ)言上得一個(gè)圖形庫(kù),其理論基礎(chǔ)也是這本書。(注,筆者曾就職的某BI巨頭,主要職責(zé)也是數(shù)據(jù)可視化,我們?cè)?jīng)和加拿大團(tuán)隊(duì)研發(fā)過(guò)類似的產(chǎn)品,基于HTML5和D3,可惜由于種種原因未能推向市場(chǎng))
現(xiàn)在越來(lái)越多的人開始使用python來(lái)做數(shù)據(jù)分析,IPython Notebook尤其令人喜愛,它的實(shí)時(shí)交互把腳本語(yǔ)言的優(yōu)勢(shì)發(fā)揮到極致。那么怎樣才能在IPython Notebook中使用ggplot呢?我這里跟大家分享三種不同的方式供大家選擇。
RPy2
第一種方式是使用rpy2, rpy2是對(duì)rpy的改寫和重新設(shè)計(jì),旨在提供Python用戶在python中使用R的API。
rpy2提供了對(duì)R語(yǔ)言的對(duì)象和方法的基本封裝,當(dāng)然也包括可視化的圖庫(kù)這一塊。
下面就是一段運(yùn)行g(shù)gplot的R程序使用rpy2在python中運(yùn)行的例子:
from rpy2 import robjects from rpy2.robjects import Formula, Environment from rpy2.robjects.vectors import IntVector, FloatVector from rpy2.robjects.lib import grid from rpy2.robjects.packages import importr, data import rpy2.robjects.lib.ggplot2 as ggplot2 # The R 'print' function rprint = robjects.globalenv.get("print") stats = importr('stats') grdevices = importr('grDevices') base = importr('base') datasets = importr('datasets') mtcars = data(datasets).fetch('mtcars')['mtcars'] pp = ggplot2.ggplot(mtcars) + \ ggplot2.aes_string(x='wt', y='mpg', col='factor(cyl)') + \ ggplot2.geom_point() + \ ggplot2.geom_smooth(ggplot2.aes_string(group = 'cyl'), method = 'lm') pp.plot()
以上程序在IPython Notebook中運(yùn)行會(huì)有缺陷,會(huì)彈出一個(gè)新的窗口顯示圖,而且該python進(jìn)程會(huì)阻塞在那里。我們希望圖表能內(nèi)嵌在IPython Notebook的頁(yè)面中,為了解決該問(wèn)題,我們引入如下代碼:
%matplotlib inline import uuid from rpy2.robjects.packages import importr from IPython.core.display import Image grdevices = importr('grDevices') def ggplot_notebook(gg, width = 800, height = 600): fn = '{uuid}.png'.format(uuid = uuid.uuid4()) grdevices.png(fn, width = width, height = height) gg.plot() grdevices.dev_off() return Image(filename=fn)
運(yùn)行上述代碼后,我們把ggplot的調(diào)用pp.plot()改為調(diào)用ggplot_notebook(pp, height=300)就能成功嵌入顯示ggplot的結(jié)果。
RMagic
另一種方式是使用rmagic,rmagicy實(shí)際上依賴于rpy2。它的使用方式更像是直接在使用R
%load_ext rmagic library(ggplot2) dat <- data.frame(x = rnorm(10), y = rnorm(10), lab = sample(c('A', 'B'), 10, replace = TRUE)) x <- ggplot(dat, aes(x = x, y = y, color = lab)) + geom_point() print(x)
運(yùn)行結(jié)果如下
ggplot for python
ggplot是一個(gè)python的庫(kù),基本上是對(duì)R語(yǔ)言ggplot的功能移植到Python上。
運(yùn)行安裝腳本
pip install ggplot
安裝成功后,可以試一下這個(gè)例子
%matplotlib inline import pandas as pd from ggplot import * meat_lng = pd.melt(meat[['date', 'beef', 'pork', 'broilers']], id_vars='date') ggplot(aes(x='date', y='value', colour='variable'), data=meat_lng) + \ geom_point() + \ stat_smooth(color='red')
結(jié)果如下:
總結(jié)
本文提供了三種不同的方式在Python(IPython Notebook)中調(diào)用ggplot。
rpy2和Rmagic都是一種對(duì)R的橋接,所以都需要安裝R。不同之處在于rpy2提供Python接口而Rmagic更接近R。
ggplot Python庫(kù)是ggplot的Python移植,所以無(wú)需安裝R,部署起來(lái)更為簡(jiǎn)單,但功能上也許和R的ggplot還有差距。
大家可以根據(jù)自己的需要做出選擇。
相關(guān)文章
Python中l(wèi)ist列表的一些進(jìn)階使用方法介紹
這篇文章主要介紹了Python中l(wèi)ist列表的一些進(jìn)階使用方法介紹,是Python入門學(xué)習(xí)中的基礎(chǔ)知識(shí),需要的朋友可以參考下2015-08-08Python&Matla實(shí)現(xiàn)模擬退火法的示例代碼
模擬退火和蒙特卡洛實(shí)驗(yàn)一樣,本文主要介紹了Python&Matla實(shí)現(xiàn)模擬退火法的示例代碼,文中通過(guò)示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2022-03-03python使用OpenCV模塊實(shí)現(xiàn)圖像的融合示例代碼
這篇文章主要介紹了python使用OpenCV模塊實(shí)現(xiàn)圖像的融合示例代碼,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2020-04-04Python cookbook(數(shù)據(jù)結(jié)構(gòu)與算法)找出序列中出現(xiàn)次數(shù)最多的元素算法示例
這篇文章主要介紹了Python cookbook(數(shù)據(jù)結(jié)構(gòu)與算法)找出序列中出現(xiàn)次數(shù)最多的元素算法,涉及Python collections模塊中的Counter類相關(guān)使用技巧與操作注意事項(xiàng),需要的朋友可以參考下2018-03-03詳解Python如何實(shí)現(xiàn)惰性導(dǎo)入-lazy import
如果你的 Python 程序程序有大量的 import,而且啟動(dòng)非常慢,那么你應(yīng)該嘗試懶導(dǎo)入,本文分享一種實(shí)現(xiàn)惰性導(dǎo)入的一種方法,需要的可以參考一下2022-10-10