我们以前的数据都存放在postgresql中,现在数据量变大了,有的表超过3千万,以后会变得越来越大,现在查询起来比较慢,想用greenplum试试,数据如何从postgresql导入greenplum呢?
数据落地的方案呢, 简单点的话,可以用pg_dump把数据从pg中dump出来,然后直接导入GP就可以了。可能慢是慢了点。 不落地的方案也蛮多的,楼上给了个工具。还可以用这个DataX,也是阿里的,我们做了一点点性能上的改进。https://github.com/HashDataIn...
数据落地的方案呢, 简单点的话,可以用pg_dump把数据从pg中dump出来,然后直接导入GP就可以了。可能慢是慢了点。
不落地的方案也蛮多的,楼上给了个工具。还可以用这个DataX,也是阿里的,我们做了一点点性能上的改进。
https://github.com/HashDataIn...