淺談python和C語言混編的幾種方式(推薦)
Python這些年風頭一直很盛,占據(jù)了很多領(lǐng)域的位置,Web、大數(shù)據(jù)、人工智能、運維均有它的身影,甚至圖形界面做的也很順,乃至full-stack這個詞語剛出來的時候,似乎就是為了描述它。
Python雖有GIL的問題導(dǎo)致多線程無法充分利用多核,但后來的multiprocess可以從多進程的角度來利用多核,甚至affinity可以綁定具體的CPU核,這個問題也算得到解決。雖基本為全棧語言,但有的時候為了效率,可能還是會去考慮和C語言混編。混編是計算機里一個不可回避的話題,涉及的東西很多,技術(shù)、架構(gòu)、團隊情況、管理、客戶等各個環(huán)節(jié)可能對其都有影響,混編這個問題我想到時候再開一貼專門討論。本文只講python和C混編的方式,大致有如下幾種方式(本文背景是linux,其他平臺可以類比):
共享庫
使用C語言編譯產(chǎn)生共享庫,然后python使用ctype庫里的cdll來打開共享庫。
舉例如下,C語言代碼為
/* func.c */int func(int a)
{
return a*a;
}
python代碼為
#!/usr/bin/env python #test_so.pyfrom ctypes import cdll import os p = os.getcwd() + '/libfunc.so' f = cdll.LoadLibrary(p) print f.func(99)
測試如下
$ gcc -fPIC -shared func.c -o libfunc.so $ ./test_so.py 9801
subprocess
C語言設(shè)計一個完整的可執(zhí)行文件,然后python通過subprocess來執(zhí)行該可執(zhí)行文件,本質(zhì)上是fork+execve。
舉例如下,C語言代碼為
/* test.c */
#include <stdio.h>
int func(int a)
{
return a*a;
}
int main(int argc, char **argv)
{
int x;
sscanf(argv[1], "%d", &x);
printf("%d\n", func(x));
return 0;
}
Python代碼為
#!/usr/bin/env python
# test_subprocess.py
import os
import subprocess
subprocess.call([os.getcwd()+'/a.out', '99'])
測試如下
$ gcc test.c -o a.out
$ ./test_subprocess.py
9801
C語言中運行python程序
C語言使用popen/system或者直接以系統(tǒng)調(diào)用級fork+exec來運行python程序也是一種混編的手段了。
舉例如下,Python代碼如下
#!/usr/bin/env python # test.py import sys x = int(sys.argv[1]) print x*x
C語言代碼如下
/* test.c */
#include <stdio.h>
#include <stdlib.h>
int main()
{
FILE *f;
char s[1024];
int ret;
f = popen("./test.py 99", "r");
while((ret=fread(s,1,1024,f))>0) {
fwrite(s,1,ret,stdout);
}
fclose(f);
return 0;
}
測試如下
$ gcc test.c $ ./a.out 9801
python對C語言擴展的支持
很多編程語言都為C語言擴展添加了支持,這有兩種原因:(1)語言設(shè)計之初,可以充分的利用C語言已有的庫來做很多擴展;(2)C語言的運行效率高。
python也不例外,從誕生那天起,很多庫都是C語言寫的。python的C語言擴展中涉及到python的數(shù)據(jù)結(jié)構(gòu)與C語言的對應(yīng),擴展方法其實是用C語言編寫一個共享庫,只是這個共享庫中的接口是一個規(guī)范的,可以被python識別的。
為了說明如何擴展,我這里先假設(shè)一個在python下的函數(shù)功能,代碼如下
def func(*a): res=1 for i in range(len(a)): res *= sum(a[i]) return res
如上,希望的函數(shù)功能是,參數(shù)是任意多個數(shù)字組成的列表(姑且排除其他數(shù)據(jù)結(jié)構(gòu)),返回每個列表的元素之和的乘積。
姑且先把python代碼寫了,如下所示
#!/usr/bin/env python # test.py import colin def func(*a): res=1 for i in range(len(a)): res *= sum(a[i]) return res a = [1,2,3] b = [4,5,6] c = [7,8] d = [9] e = [10,11,12,13,14] f = colin.func2(99) g = colin.func3(a,b,c,d,e) h = func3(a,b,c,d,e) print "f = ",f print "g = ",g print "h = ",h
帶上之前一直測試的平方func,這個實現(xiàn)相對簡單,希望python寫出來的func可以和C語言擴展出來的結(jié)果一致。
先用C語言寫上這些函數(shù)的實現(xiàn),其中func3用上了一個表示任意多個任意長的數(shù)組的數(shù)據(jù)結(jié)構(gòu)y_t,而x_t用來表示單個數(shù)組。
/* colin.h */
#ifndef Colin_h
#define Colin_h
typedef struct {
int *a;
int len;
} x_t;
typedef struct {
x_t *ax;
int len;
} y_t;
int func2(int a);
int func3(y_t *p);
void free_y_t(y_t *p);
#endif
/* colin.c */
#include "colin.h"
#include <stdlib.h>
int func2(int a)
{
return a*a;
}
int func3(y_t *p)
{
int result;
int sum;
int i, j;
result = 1;
for(i=0;i<p->len;i++) {
sum = 0;
for(j=0;j<p->ax[i].len;j++)
sum += p->ax[i].a[j];
result *= sum;
}
return result;
}
void free_y_t(y_t *p)
{
int i;
for(i=0;i<p->len;i++) {
free(p->ax[i].a);
}
free(p->ax);
}
上面定義了三個函數(shù),func2代表平方,func3代表之前所說的功能,又因y_t這個結(jié)構(gòu)可能都是動態(tài)分配出來的,所以給個歸還內(nèi)存的方法。
剛才說過python擴展的話,需要把這個共享庫的接口“標準化”一下。于是我們就包裝一下,并給個python加載的入口。
/* wrap.c */
#include <Python.h>
#include <stdlib.h>
#include "colin.h"
PyObject* wrap_func2(PyObject* self, PyObject* args)
{
int n, result;
/* 從參數(shù)列表中導(dǎo)出一個整形,用"i" */
if (!PyArg_ParseTuple(args, "i", &n))
return NULL;
/* 用C語言的庫實現(xiàn)來計算 */
result = func2(n);
/* 計算結(jié)果必須要導(dǎo)成python識別的類型 */
return Py_BuildValue("i", result);
}
PyObject* wrap_func3(PyObject* self, PyObject* args)
{
int n, result;
int i, j;
int size, size2;
PyObject *p,*q;
y_t *y;
y = malloc(sizeof(y_t));
/* 先數(shù)數(shù)有多少個參數(shù),也就是列表的個數(shù) */
size = PyTuple_Size(args);
/* 把數(shù)組的個數(shù)先分配了 */
y->len = size;
y->ax = malloc(sizeof(x_t)*size);
/* 遍歷python里各個列表(參數(shù)) */
for(i=0;i<size;i++) {
/* 先獲得第i個參數(shù),是一個列表 */
p = PyTuple_GetItem(args, i);
/* 獲得列表的長度 */
size2 = PyList_Size(p);
/* 為數(shù)組分配好空間 */
y->ax[i].len = size2;
y->ax[i].a = malloc(sizeof(int)*size2);
/* 遍歷列表,依次把列表里的數(shù)轉(zhuǎn)到數(shù)組里 */
for(j=0;j<size2;j++) {
q = PyList_GetItem(p, j);
PyArg_Parse(q,"i",&y->ax[i].a[j]);
}
}
/* 用C語言的庫實現(xiàn)來計算 */
result = func3(y);
free_y_t(y);
free(y);
/* 結(jié)果轉(zhuǎn)成python識別格式 */
return Py_BuildValue("i", result);
}
/* 這是接口列表,加載時是只加載此列表的地址,所以這個數(shù)據(jù)結(jié)構(gòu)不能放棧(局部變量)內(nèi),會被清掉 */
static PyMethodDef colinMethods[] =
{
{"func2", wrap_func2, METH_VARARGS, "Just a test"},
{"func3", wrap_func3, METH_VARARGS, "Just a test"},
{NULL, NULL, METH_NOARGS, NULL}
};
/* python加載的時候的接口 */
/* 注意,既然庫名叫colin,此函數(shù)必須交initcolin */
void initcolin()
{
PyObject *m;
m = Py_InitModule("colin", colinMethods);
}
過程中,我猜測PyArg_VaParse應(yīng)該功能更為強大,可是反復(fù)測沒有成功,也沒細看文檔。
測試一下
$ gcc -I /usr/include/python2.7/ -fPIC -shared colin.c wrap.c -o colin.so $ ./test.py f = 9801 g = 729000 h = 729000
可以看到,C語言寫的函數(shù)和python寫的函數(shù)結(jié)果一致。
以上這篇淺談python和C語言混編的幾種方式(推薦)就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
python 轉(zhuǎn)換 Javascript %u 字符串為python unicode的代碼
這篇文章主要介紹了python 轉(zhuǎn)換 Javascript %u 字符串為python unicode的代碼,需要的朋友可以參考下2016-09-09
python 插入Null值數(shù)據(jù)到Postgresql的操作
這篇文章主要介紹了python 插入Null值數(shù)據(jù)到Postgresql的操作,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2021-03-03
詳解pandas中iloc, loc和ix的區(qū)別和聯(lián)系
這篇文章主要介紹了詳解pandas中iloc, loc和ix的區(qū)別和聯(lián)系,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2020-03-03
關(guān)于TensorBoard的使用以及遇到的坑記錄
這篇文章主要介紹了關(guān)于TensorBoard的使用以及遇到的坑記錄,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2023-09-09
Python操作MongoDB的教程詳解(插,查,改,排,刪)
MongoDB是一個基于分布式文件存儲的數(shù)據(jù)庫。是一個介于關(guān)系數(shù)據(jù)庫和非關(guān)系數(shù)據(jù)庫之間的產(chǎn)品,是非關(guān)系數(shù)據(jù)庫當中功能最豐富,最像關(guān)系數(shù)據(jù)庫的。本文將詳細和大家聊聊Python操作MongoDB的方法,需要的可以參考一下2022-09-09

