impala 执行结果插入依赖表所在的 location

图片描述

这是第二次遇到这个问题了
问题描述:
使用 impala 跑定时任务,语句如下:
insert overwrite table test partition (dt='20161212')
select school_id,count(distinct user_id) as num from user;
跑了很久都没有问题,突然一天数据出问题了,然后找原因,就发现,本来应该存储在 test 表中的数据,竟然被写到了 user 表中,本来以为是自己手误写错了脚本,后来查找也没有发现代码有什么改动,当时就没有管这个事,毕竟重补数就好了,一切如旧

结果今天一同事也出现这样的问题,也是计算结果被插入到了依赖表中,而且他的更奇怪,他的是部分数据被写到了依赖表的location中,另外的数据还是在正确的目录

看来impala 的坑不是一点半点
这次截个图为证

阅读 2.6k
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
宣传栏