Python中如何与小伙伴一起开发一个高效的数据迁移工具?

我的目标是写一个尽量全面,易用和高性能的数据迁移工具,目前只是基本可以用的状态(代码就 1000 行)。对这个项目感兴趣,想要提高自己 python 功底,加深对数据库的理解的朋友快来呀~ https://github.com/toaco/carry

目前需要做的
- 并发,缓存,压缩, 数据库本身的 LOAD 和 EXPORT 功能
- 功能完善
- 测试
Python中如何与小伙伴一起开发一个高效的数据迁移工具?


29 回复

Python2.7 吗?


要和小伙伴一起高效开发Python数据迁移工具,建议用Git做版本控制,配合GitHub/GitLab。用pandas处理数据转换,SQLAlchemy处理数据库连接。关键是把迁移逻辑拆成模块,比如数据提取、转换、加载各一个模块,这样大家能并行开发。用argparseclick做个命令行接口,方便调用。写清楚文档和单元测试,用pytest

简单说就是:模块化设计,用好版本控制和测试。

目前是 2.7,如果要用 3 的话我可以改

看看阿里的 datax,然后在再考虑自己写。

只有 python web 能加入吗

肯定可以呀,做 web 的都会数据库~

这咋讨论微信吗?

这个数据迁移是做数据库迁移还是硬盘所有类型数据迁移啊?

近期倒是有想法把 xls 类的文件数据导入到数据库中。用 python3

微信,jfry898996

目前支持 csv 和数据库,目标是尽量支持多种类型的数据源,比如 excel 等

wow。这目录结构整齐划一的 reader, writer, reader, writer, reader, writer, reader, writer, reader, writer

https://github.com/alibaba/DataX

不多说了赶紧 star。

什么水平都可以参与吗?😬非计算机专业趁寒假在家自学的可以参与吗?

有钉钉群么

嗯,都可以的。但是如果你是为了做 web,爬虫什么而学 python 的话最好去做相关的项目。

没有,只有 WX

可以试试 Slack

嗯,好的。那我暂时不参与了

举手🙋

欢迎~

python 渣渣也能加入吗 =。=

感兴趣就可以呀=。=

三手 Python,很感兴趣,先 star 一波,话说怎么加入啊?有木有 contribute 规范呢?

想加入~

大佬,注册好了,然后怎么玩

点上面那个 slack 链接进来就行~

看里面的#general channel

先看看 datax,最近也在鼓捣这个东西,可惜不会 py

加入了 slack 去看看项目具体内容

回到顶部