相比 Python 代码,Cython 实际提升的性能有多大?
有用过 Cython 的同学,说下实际效果吗?兼容性方面怎么样?
相比 Python 代码,Cython 实际提升的性能有多大?
Ref: http://notes-on-cython.readthedocs.io/en/latest/std_dev.html
Example:
def pyStdDev(a):
mean = sum(a) / len(a)
return math.sqrt((sum(((x - mean)**2 for x in a)) / len(a)))
In summary:
================= ============ ================== =====================
Method Time (ms) Compared to Python Compared to Numpy
================= ============ ================== =====================
Pure Python 183 x1 x0.03
Numpy 5.97 x31 x1
Naive Cython 7.76 x24 x0.8
Optimised Cython 2.18 x84 x2.7
Cython calling C 2.22 x82 x2.7
================= ============ ================== =====================
Cython的实际性能提升取决于具体场景。对于纯Python代码,Cython通过静态类型声明和编译成C代码,通常能带来2-5倍的加速。如果是计算密集型任务(比如数值计算、循环操作),通过添加cdef类型声明,性能可以提升10-50倍甚至更高。
举个例子,计算斐波那契数列的纯Python代码:
def fib_py(n):
if n <= 1:
return n
a, b = 0, 1
for _ in range(n - 1):
a, b = b, a + b
return b
用Cython优化后:
cpdef int fib_cy(int n):
if n <= 1:
return n
cdef int a = 0, b = 1, i
for i in range(n - 1):
a, b = b, a + b
return b
在我的测试中(n=1000000),Cython版本比纯Python快约15倍。但如果是I/O密集型任务,提升就很小了。关键是要合理使用cdef声明变量类型,避免不必要的Python对象操作。
总结:计算越密集,Cython提升越大。
Numpy 真是神器
如果涉及数值计算的话,numba 可能用起来更方便,cython 毕竟还要显性配置些东西
首先你要清楚程序的瓶颈在什么,这一阶段可以用 pyflame ( https://github.com/uber/pyflame ), systemtap( https://docs.python.org/3/howto/instrumentation.html) 等工具导出 flamegraph。如果是语言实现引起的瓶颈,那可以考虑上 Cython. 如果你的程序用标准的 cpython 运行,那 Cython 兼容性很好。
一般来说 Python 的 socket 慢,CPU 密集型计算也慢,这种情况就特别适合用 Cython 做胶水层,把瓶颈部分用 C 或 C++实现。至于能快多少,场景不同,实现也不同,不能一句话告诉你有多块,主要取决于你的 C++ / C 代码有多快。


