使用Protocol Buffers的C語(yǔ)言拓展提速Python程序的示例
Protocol Buffers (類似XML的一種數(shù)據(jù)描述語(yǔ)言)最新版本2.3里,protoc—py_out命令只生成原生的Python代碼。 盡管PB(Protocol Buffers)可以為C++語(yǔ)言生成快速解析和序列化代碼,但是這種方式對(duì)于Python不適用,并且手動(dòng)生成的已包裝的代碼需要非常大的維護(hù)工作。在討論組里,這是一個(gè)常見(jiàn)的功能要求,由于一個(gè)必備的客戶端組件—AppEngine(根據(jù)團(tuán)隊(duì)介紹名稱為AppEngine),生成原生的Python代碼有更高的優(yōu)先級(jí)。
幸運(yùn)的是, PB 2.4版本中本地化代碼已被提名,在 svn的分支中已經(jīng)可以下載,因此你能夠使用快速的 PB有一段時(shí)間了。 (我們使用 r352版本有一段時(shí)間了,還沒(méi)有遇到任何問(wèn)題。) PB團(tuán)隊(duì)一直不愿輕易指定任何發(fā)布日期,在我的威脅下, Kenton Varda提到日期初步定在 2011年初。
我沒(méi)有在其它地方看見(jiàn)過(guò)這個(gè)文檔,希望它能對(duì)其他人有所幫助.
如何做能讓它快起來(lái)
安裝好新的PB庫(kù)之后并使用 protoc --py_out=... 重新構(gòu)建好你的PB之后,你需要在運(yùn)行你的Python程序之前進(jìn)行環(huán)境變量 PROTOCOL_BUFFERS_PYTHON_IMPLEMENTATION=cpp 的設(shè)置,以便于選擇C++的,或者PB默認(rèn)使用的Python實(shí)現(xiàn).
就這樣了!這至少就能在可以動(dòng)態(tài)轉(zhuǎn)化/序列化消息的PB運(yùn)行時(shí)庫(kù)用通用的C++代碼了. (注意我們還沒(méi)有生成任何C++代碼.)
它能有多快呢? 我編寫(xiě)了一個(gè)簡(jiǎn)單的程序來(lái)獲得性能在我們的應(yīng)用程序中的提升感觀:
nruns = 1000nwarmups = 100xs = ... # your protobufsdef ser(): return [x.SerializeToString() for x in xs]def parse(ys): for y in ys: pb.Email().ParseFromString(y) t = timeit.Timer(lambda:None) t.timeit(nwarmups)print 'noop:', t.timeit(nruns) / nruns t = timeit.Timer(ser) t.timeit(nwarmups)print 'ser:', t.timeit(nruns) / nruns / len(xs) ys = ser() t = timeit.Timer(lambda: parse(ys)) t.timeit(nwarmups)print 'parse:', t.timeit(nruns) / nruns / len(xs)print 'msg size:', sum(len(y) for y in ys) / len(ys)
以秒為單位,這段程序在我的桌面上給出了如下幾個(gè)時(shí)間結(jié)果:
$ python sandbox/pbbench.py out.ini ser: 0.000434461673101 parse: 0.000602062404156 msg size: 10730 $ PROTOCOL_BUFFERS_PYTHON_IMPLEMENTATION=cpp \ > python sandbox/pbbench.py out.ini ser: 2.86788344383e-05 parse: 7.63910810153e-05 msg size: 10730
這顯示出在序列化和轉(zhuǎn)化方面分別有15和8被的速度提升。不壞!但還可以更快.
如何做讓它更快
現(xiàn)在我們實(shí)際上只是特地針對(duì)你的PB生成了一個(gè)C++實(shí)現(xiàn),而我們從來(lái)沒(méi)有使用過(guò)運(yùn)行時(shí)反射。首先,為你的Python項(xiàng)目添加一個(gè)C擴(kuò)展,不如,通過(guò)修改如下的 setup.py:
setup(
...
ext_modules=[Extension('podpb',
sources=['cpp/podpb.c','cpp/main.pb.cc'], libraries=['protobuf'])],
...
)
使用 protoc --cpp_out=cpp 生成main.pb.c, 并按如下所示創(chuàng)建 podpb.c 來(lái)設(shè)置一個(gè)空的 Python C 模塊:
#include <Python.h>
static PyMethodDef PodMethods[] = {
{NULL, NULL, 0, NULL} /* Sentinel */};
PyMODINIT_FUNC
initpodpb(void)
{
PyObject *m;
m = Py_InitModule("podpb", PodMethods); if (m == NULL) return;
}
現(xiàn)在就運(yùn)行 python setup.py build 命令會(huì)構(gòu)建所有的東西. 只要將C模塊(在這里是podpb)導(dǎo)入到你的項(xiàng)目中,PB 運(yùn)行時(shí)庫(kù)就將會(huì)自動(dòng)使用 C++ 實(shí)現(xiàn)了.
現(xiàn)在我們就分別有了68倍x 和 13倍 的速度提升. 吼吼.
$ PYTHONPATH=build/lib.linux-x86_64-2.6/:$PYTHONPATH \ > PROTOCOL_BUFFERS_PYTHON_IMPLEMENTATION=cpp \ > python sandbox/pbbench.py out.ini ser: 6.39575719833e-06 parse: 4.55250144005e-05 msg size: 10730
我這篇文章發(fā)布到很多地方,大事完全忘了它的存在。同時(shí) connex.io 和 Greplin 發(fā)布了他們的原生的 Python實(shí)現(xiàn),cypb和fast-python-pb。cypb在PB的郵件列表中公布過(guò),可以運(yùn)行,但仍需要提升到可用的狀態(tài)。fast-python-pb目前只支持string int32, int64 雙精度浮點(diǎn)和子消息成員。除了這些項(xiàng)目,其他的我都不了解。你也可以查看我的orginal thread PB郵列表來(lái)了解到這些。
相關(guān)文章
numpy.array 操作使用簡(jiǎn)單總結(jié)
這篇文章主要介紹了numpy.array 操作使用簡(jiǎn)單總結(jié),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2019-11-11
vue.js實(shí)現(xiàn)輸入框輸入值內(nèi)容實(shí)時(shí)響應(yīng)變化示例
這篇文章主要介紹了vue.js實(shí)現(xiàn)輸入框輸入值內(nèi)容實(shí)時(shí)響應(yīng)變化,結(jié)合實(shí)例形式分析了vue.js使用v-model屬性進(jìn)行數(shù)據(jù)綁定的相關(guān)操作技巧,需要的朋友可以參考下2018-07-07
基于Pygame實(shí)現(xiàn)簡(jiǎn)單的貪吃蛇游戲
Pygame是一個(gè)專門用來(lái)開(kāi)發(fā)游戲的Python模塊,主要用于開(kāi)發(fā)、設(shè)計(jì)?2D?電子游戲。本文主要為大家介紹了通過(guò)Pygame制作一個(gè)簡(jiǎn)單的貪吃蛇游戲,感興趣的同學(xué)可以關(guān)注一下2021-12-12
Pandas數(shù)據(jù)操作及數(shù)據(jù)分析常用技術(shù)介紹
Pandas是Python中用于數(shù)據(jù)處理和數(shù)據(jù)分析的庫(kù),具有強(qiáng)大的數(shù)據(jù)操作和分析功能,包括數(shù)據(jù)清洗、轉(zhuǎn)換、篩選、聚合等。常用技術(shù)有數(shù)據(jù)讀取與寫(xiě)入、數(shù)據(jù)索引、數(shù)據(jù)切片、數(shù)據(jù)合并、數(shù)據(jù)透視表、數(shù)據(jù)可視化等,適用于各種數(shù)據(jù)分析和機(jī)器學(xué)習(xí)任務(wù)2023-04-04
python paramiko利用sftp上傳目錄到遠(yuǎn)程的實(shí)例
今天小編就為大家分享一篇python paramiko利用sftp上傳目錄到遠(yuǎn)程的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-01-01
python 讀取數(shù)據(jù)庫(kù)并繪圖的實(shí)例
今天小編就為大家分享一篇python 讀取數(shù)據(jù)庫(kù)并繪圖的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-12-12

