【问题分类】数据导入导出

【关键字】数据同步,kettle,数据迁移,java内存溢出

【问题描述】kettle同步大表提示ERROR:could not create the java virtual machine!

【问题原因分析】java内存溢出

【解决/规避方法】

①增加JVM的堆内存大小。编辑Spoon.bat,增加堆大小到2GB,如:

if "%PENTAHO_DI_JAVA_OPTIONS%"=="" set PENTAHO_DI_JAVA_OPTIONS="-Xms512m" "-Xmx512m" "-XX:MaxPermSize=256m" "-Dsun.jnu.encoding=UTF8"

#其中-Xms是初始堆大小,-Xmx是最大堆大小。

②优化Kettle转换。检查步骤是否有优化空间,例如通过调整批量大小、优化数据库查询、减少不必要的步骤等。

③通过PARALLELISM参数的值合理设置并行线程数,如:

time PENTAHO_DI_JAVA_OPTIONS=-DPARALLELISM=4 sh /home/kettle/data-integration/pan.sh -file=/home/kettle/data-integration/test/dir_ktr1/public.T1.k

tr > /home/kettle/data-integration/test/logs1/public.T1.log

【影响范围】所有版本

【修复版本】-


YashanDB
1 声望0 粉丝

崖山数据库系统YashanDB是深圳计算科学研究院自主设计研发的新型数据库管理系统,融入原创的有界计算、近似计算、并行可扩展和跨模融合计算理论,可满足金融、政企、能源等关键行业对高性能、高并发及高安全性的...