【问题分类】数据导入导出

【关键字】数据同步,kettle,数据迁移,java 内存溢出

【问题描述】kettle 同步大表提示 ERROR:could not create the java virtual machine!

【问题原因分析】java 内存溢出

【解决/规避方法】

①增加 JVM 的堆内存大小。编辑 Spoon.bat,增加堆大小到 2GB,如:
if "%PENTAHO_DI_JAVA_OPTIONS%"=="" set PENTAHO_DI_JAVA_OPTIONS="-Xms512m" "-Xmx512m" "-XX:MaxPermSize=256m" "-Dsun.jnu.encoding=UTF8"

其中-Xms是初始堆大小,-Xmx是最大堆大小。

②优化 Kettle 转换。检查步骤是否有优化空间,例如通过调整批量大小、优化数据库查询、减少不必要的步骤等。

③通过 PARALLELISM 参数的值合理设置并行线程数,如:
time PENTAHO_DI_JAVA_OPTIONS=-DPARALLELISM=4 sh /home/kettle/data-integration/pan.sh -file=/home/kettle/data-integration/test/dir_ktr1/public.T1.k

tr > /home/kettle/data-integration/test/logs1/public.T1.log
【影响范围】所有版本

【修复版本】-


qiaoyikefu
1 声望0 粉丝