- 面临的问题
旧表(sqlserver)中有1500万条用数据,需要快速导入到新表(mysql)中
时间控制在2小时以内
用户数据有关联关系表2张,导入新表后,之前的用户id已新表的主键为新的用户Uid需要在这个时间内,将3张表(共4500万数据)导入到mysql中
- 开发语言及ORM选择
Python 3.6.5
SQLAlchemy 1.3.3 -
初步想法
- 单次查询1000条数据
- 通过SQLAlchemy提供的bulk_insert_mappings方法批量插入用户表
- 关联表的数据,需要查一次新表的数据,将旧uid与新表的uid关系对应,再批量插入新的关联关系表中
有没有更好的方法???
如果考虑不影响线上业务的前提下: