Python中UCBerkeley开发的分布式计算框架,性能超越Spark和MapReduce吗?

标题只是打个广告。。。。灵感来自逼乎问题: 如何看 UCBerkeley RISELab 即将问世的 Ray,replacement of Spark ?

项目在 github

https://github.com/ray-project/ray

里面有个 plasma 组件挺好用的。 zero copy 的共享内存对象存储引擎。

https://arrow.apache.org/blog/2017/08/08/plasma-in-memory-object-store/


Python中UCBerkeley开发的分布式计算框架,性能超越Spark和MapReduce吗?

5 回复

前排围观,现在学 python 还来得及么,哈哈哈


我用过了。看下性能。并没有那么理想

没仔细看,不过看到说用 arrow,如果 zero copy 是卖点,那么没啥新奇的,spark 也用了 arrow

看了下是分布深度学习框架?这个好像和 spark 差得远了点?

ray 是基于 actor model 做强化学习的分布式框架,框架确实解决了不少分布式机器学习的痛点。

回到顶部