相比 Python 代码,Cython 实际提升的性能有多大?

有用过 Cython 的同学,说下实际效果吗?兼容性方面怎么样?
相比 Python 代码,Cython 实际提升的性能有多大?

8 回复

Ref: http://notes-on-cython.readthedocs.io/en/latest/std_dev.html

Example:

def pyStdDev(a):
mean = sum(a) / len(a)
return math.sqrt((sum(((x - mean)**2 for x in a)) / len(a)))


In summary:

================= ============ ================== =====================
Method Time (ms) Compared to Python Compared to Numpy
================= ============ ================== =====================
Pure Python 183 x1 x0.03
Numpy 5.97 x31 x1
Naive Cython 7.76 x24 x0.8
Optimised Cython 2.18 x84 x2.7
Cython calling C 2.22 x82 x2.7
================= ============ ================== =====================


Cython的实际性能提升取决于具体场景。对于纯Python代码,Cython通过静态类型声明和编译成C代码,通常能带来2-5倍的加速。如果是计算密集型任务(比如数值计算、循环操作),通过添加cdef类型声明,性能可以提升10-50倍甚至更高。

举个例子,计算斐波那契数列的纯Python代码:

def fib_py(n):
    if n <= 1:
        return n
    a, b = 0, 1
    for _ in range(n - 1):
        a, b = b, a + b
    return b

用Cython优化后:

cpdef int fib_cy(int n):
    if n <= 1:
        return n
    cdef int a = 0, b = 1, i
    for i in range(n - 1):
        a, b = b, a + b
    return b

在我的测试中(n=1000000),Cython版本比纯Python快约15倍。但如果是I/O密集型任务,提升就很小了。关键是要合理使用cdef声明变量类型,避免不必要的Python对象操作。

总结:计算越密集,Cython提升越大。

Numpy 真是神器

如果涉及数值计算的话,numba 可能用起来更方便,cython 毕竟还要显性配置些东西

可以提升至 C/C++效率, 兼容性是 C/C++的兼容性(毕竟 cython 转译出来的就是.c/.cpp)

首先你要清楚程序的瓶颈在什么,这一阶段可以用 pyflame ( https://github.com/uber/pyflame ), systemtap( https://docs.python.org/3/howto/instrumentation.html) 等工具导出 flamegraph。如果是语言实现引起的瓶颈,那可以考虑上 Cython. 如果你的程序用标准的 cpython 运行,那 Cython 兼容性很好。

一般来说 Python 的 socket 慢,CPU 密集型计算也慢,这种情况就特别适合用 Cython 做胶水层,把瓶颈部分用 C 或 C++实现。至于能快多少,场景不同,实现也不同,不能一句话告诉你有多块,主要取决于你的 C++ / C 代码有多快。

回到顶部