Python中如何与小伙伴一起开发一个高效的数据迁移工具?
我的目标是写一个尽量全面,易用和高性能的数据迁移工具,目前只是基本可以用的状态(代码就 1000 行)。对这个项目感兴趣,想要提高自己 python 功底,加深对数据库的理解的朋友快来呀~ https://github.com/toaco/carry
目前需要做的
- 并发,缓存,压缩, 数据库本身的 LOAD 和 EXPORT 功能
- 功能完善
- 测试
Python中如何与小伙伴一起开发一个高效的数据迁移工具?
Python2.7 吗?
要和小伙伴一起高效开发Python数据迁移工具,建议用Git做版本控制,配合GitHub/GitLab。用pandas处理数据转换,SQLAlchemy处理数据库连接。关键是把迁移逻辑拆成模块,比如数据提取、转换、加载各一个模块,这样大家能并行开发。用argparse或click做个命令行接口,方便调用。写清楚文档和单元测试,用pytest。
简单说就是:模块化设计,用好版本控制和测试。
目前是 2.7,如果要用 3 的话我可以改
看看阿里的 datax,然后在再考虑自己写。
只有 python web 能加入吗
肯定可以呀,做 web 的都会数据库~
这咋讨论微信吗?
这个数据迁移是做数据库迁移还是硬盘所有类型数据迁移啊?
近期倒是有想法把 xls 类的文件数据导入到数据库中。用 python3
微信,jfry898996
目前支持 csv 和数据库,目标是尽量支持多种类型的数据源,比如 excel 等
wow。这目录结构整齐划一的 reader, writer, reader, writer, reader, writer, reader, writer, reader, writer
https://github.com/alibaba/DataX
不多说了赶紧 star。
什么水平都可以参与吗?😬非计算机专业趁寒假在家自学的可以参与吗?
有钉钉群么
嗯,都可以的。但是如果你是为了做 web,爬虫什么而学 python 的话最好去做相关的项目。
没有,只有 WX
可以试试 Slack
嗯,好的。那我暂时不参与了
举手🙋
欢迎~
python 渣渣也能加入吗 =。=
感兴趣就可以呀=。=
三手 Python,很感兴趣,先 star 一波,话说怎么加入啊?有木有 contribute 规范呢?
想加入~
大佬,注册好了,然后怎么玩
点上面那个 slack 链接进来就行~
看里面的#general channel
先看看 datax,最近也在鼓捣这个东西,可惜不会 py
加入了 slack 去看看项目具体内容

