Python優(yōu)化技巧之利用ctypes提高執(zhí)行速度
首先給大家分享一個(gè)個(gè)人在使用python的ctypes調(diào)用c庫(kù)的時(shí)候遇到的一個(gè)小坑
這次出問(wèn)題的地方是一個(gè)C函數(shù),返回值是malloc生成的字符串地址。平常使用也沒(méi)問(wèn)題,也用了有段時(shí)間, 沒(méi)發(fā)現(xiàn)什么異常。
這次在測(cè)試中,發(fā)現(xiàn)使用這個(gè)過(guò)程會(huì)出現(xiàn)“段錯(cuò)誤”,造成程序退出了。
經(jīng)過(guò)排查, 確定問(wèn)題原因是C函數(shù)的返回值問(wèn)題,ctypes默認(rèn)的函數(shù)返回類(lèi)型是int類(lèi)型。
需要在使用中設(shè)置返回類(lèi)型,例如:
func.restype = c_char_p
下面我們就來(lái)詳細(xì)探討下ctypes的使用小技巧
ctypes 庫(kù)可以讓開(kāi)發(fā)者借助C語(yǔ)言進(jìn)行開(kāi)發(fā)。這個(gè)引入C語(yǔ)言的接口可以幫助我們做很多事情,比如需要調(diào)用C代碼的來(lái)提高性能的一些小型問(wèn)題。通過(guò)它你可以接入Windows系統(tǒng)上的 kernel32.dll 和 msvcrt.dll 動(dòng)態(tài)鏈接庫(kù),以及Linux系統(tǒng)上的 libc.so.6 庫(kù)。當(dāng)然你也可以使用自己的編譯好的共享庫(kù)
我們先來(lái)看一個(gè)簡(jiǎn)單的例子 我們使用 Python 求 1000000 以內(nèi)素?cái)?shù),重復(fù)這個(gè)過(guò)程10次,并計(jì)算運(yùn)行時(shí)間。
import math
from timeit import timeit
def check_prime(x):
values = xrange(2, int(math.sqrt(x)) + 1)
for i in values:
if x % i == 0:
return False
return True
def get_prime(n):
return [x for x in xrange(2, n) if check_prime(x)]
print timeit(stmt='get_prime(1000000)', setup='from __main__ import get_prime',
number=10)
Output
42.8259568214
下面用C語(yǔ)言寫(xiě)一個(gè)的 check_prime 函數(shù),然后把它當(dāng)作共享庫(kù)(動(dòng)態(tài)鏈接庫(kù))導(dǎo)入
#include <stdio.h>
#include <math.h>
int check_prime(int a)
{
int c;
for ( c = 2 ; c <= sqrt(a) ; c++ ) {
if ( a%c == 0 )
return 0;
}
return 1;
}
使用以下命令生成 .so (shared object)文件
gcc -shared -o prime.so -fPIC prime.c
import ctypes
import math
from timeit import timeit
check_prime_in_c = ctypes.CDLL('./prime.so').check_prime
def check_prime_in_py(x):
values = xrange(2, int(math.sqrt(x)) + 1)
for i in values:
if x % i == 0:
return False
return True
def get_prime_in_c(n):
return [x for x in xrange(2, n) if check_prime_in_c(x)]
def get_prime_in_py(n):
return [x for x in xrange(2, n) if check_prime_in_py(x)]
py_time = timeit(stmt='get_prime_in_py(1000000)', setup='from __main__ import get_prime_in_py',
number=10)
c_time = timeit(stmt='get_prime_in_c(1000000)', setup='from __main__ import get_prime_in_c',
number=10)
print "Python version: {} seconds".format(py_time)
print "C version: {} seconds".format(c_time)
Output
Python version: 43.4539749622 seconds C version: 8.56250786781 seconds
我們可以看到很明顯的性能差距 這里 有更多的方法去判斷一個(gè)數(shù)是否是素?cái)?shù)
再來(lái)看一個(gè)復(fù)雜點(diǎn)的例子 快速排序
mylib.c
#include <stdio.h>
typedef struct _Range {
int start, end;
} Range;
Range new_Range(int s, int e) {
Range r;
r.start = s;
r.end = e;
return r;
}
void swap(int *x, int *y) {
int t = *x;
*x = *y;
*y = t;
}
void quick_sort(int arr[], const int len) {
if (len <= 0)
return;
Range r[len];
int p = 0;
r[p++] = new_Range(0, len - 1);
while (p) {
Range range = r[--p];
if (range.start >= range.end)
continue;
int mid = arr[range.end];
int left = range.start, right = range.end - 1;
while (left < right) {
while (arr[left] < mid && left < right)
left++;
while (arr[right] >= mid && left < right)
right--;
swap(&arr[left], &arr[right]);
}
if (arr[left] >= arr[range.end])
swap(&arr[left], &arr[range.end]);
else
left++;
r[p++] = new_Range(range.start, left - 1);
r[p++] = new_Range(left + 1, range.end);
}
}
gcc -shared -o mylib.so -fPIC mylib.c
使用ctypes有一個(gè)麻煩點(diǎn)的地方是原生的C代碼使用的類(lèi)型可能跟Python不能明確的對(duì)應(yīng)上來(lái)。比如這里什么是Python中的數(shù)組?列表?還是 array 模塊中的一個(gè)數(shù)組。所以我們需要進(jìn)行轉(zhuǎn)換
test.py
import ctypes
import time
import random
quick_sort = ctypes.CDLL('./mylib.so').quick_sort
nums = []
for _ in range(100):
r = [random.randrange(1, 100000000) for x in xrange(100000)]
arr = (ctypes.c_int * len(r))(*r)
nums.append((arr, len(r)))
init = time.clock()
for i in range(100):
quick_sort(nums[i][0], nums[i][1])
print "%s" % (time.clock() - init)
Output
1.874907
與Python list 的 sort 方法進(jìn)行對(duì)比
import ctypes
import time
import random
quick_sort = ctypes.CDLL('./mylib.so').quick_sort
nums = []
for _ in range(100):
nums.append([random.randrange(1, 100000000) for x in xrange(100000)])
init = time.clock()
for i in range(100):
nums[i].sort()
print "%s" % (time.clock() - init)
Output
2.501257
至于結(jié)構(gòu)體,需要定義一個(gè)類(lèi),包含相應(yīng)的字段和類(lèi)型
class Point(ctypes.Structure):
_fields_ = [('x', ctypes.c_double),
('y', ctypes.c_double)]
除了導(dǎo)入我們自己寫(xiě)的C語(yǔ)言擴(kuò)展文件,我們還可以直接導(dǎo)入系統(tǒng)提供的庫(kù)文件,比如linux下c標(biāo)準(zhǔn)庫(kù)的實(shí)現(xiàn) glibc
import time
import random
from ctypes import cdll
libc = cdll.LoadLibrary('libc.so.6') # Linux系統(tǒng)
# libc = cdll.msvcrt # Windows系統(tǒng)
init = time.clock()
randoms = [random.randrange(1, 100) for x in xrange(1000000)]
print "Python version: %s seconds" % (time.clock() - init)
init = time.clock()
randoms = [(libc.rand() % 100) for x in xrange(1000000)]
print "C version : %s seconds" % (time.clock() - init)
Output
Python version: 0.850172 seconds C version : 0.27645 seconds
以上都是ctypes的基本技巧,對(duì)普通的開(kāi)發(fā)人員來(lái)說(shuō),基本夠用了
更詳細(xì)的說(shuō)明請(qǐng)參考:http://docs.python.org/library/ctypes.html
相關(guān)文章
Python使用 Beanstalkd 做異步任務(wù)處理的方法
這篇文章主要介紹了Python使用 Beanstalkd 做異步任務(wù)處理的方法,小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2018-04-04
python shell根據(jù)ip獲取主機(jī)名代碼示例
這篇文章主要介紹了python shell根據(jù)ip獲取主機(jī)名代碼示例,涉及用socket模塊和shell中hostname命令獲取等相關(guān)內(nèi)容,具有一定參考價(jià)值,需要的朋友可以了解下。2017-11-11
昨晚我用python幫隔壁小姐姐P證件照然后發(fā)現(xiàn)
大家好,我是Lex 喜歡欺負(fù)超人那個(gè)Lex 建議大家收藏哦,以后幫小姐姐P自拍,證件照,調(diào)尺寸,背景,摳圖,直接10行代碼搞定,瞬間高大上2021-08-08
Python用5行代碼實(shí)現(xiàn)批量摳圖的示例代碼
這篇文章主要介紹了Python用5行代碼實(shí)現(xiàn)批量摳圖的示例代碼,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2020-04-04
解決PyQt5 無(wú)邊框后窗口的移動(dòng)問(wèn)題
這篇文章主要介紹了解決PyQt5 無(wú)邊框后窗口的移動(dòng)問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,一起跟隨小編過(guò)來(lái)看看吧2021-03-03
移動(dòng)測(cè)試開(kāi)發(fā)Mitmproxy用于測(cè)試抓包神器詳解
這篇文章主要為大家介紹了python移動(dòng)測(cè)試開(kāi)發(fā)Mitmproxy抓包神器使用示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-06-06

