greenplum 外表在修改master,pg_exttable的数据字典。segment中不受影响

新手上路,请多包涵

我创建一张外表
CREATE EXTERNAL TABLE yyw_ext(name )LOCATION ('gpfdist://10.199.111.239:8081/yyw_ext.txt')FORMAT 'text' (delimiter 't' null '\N' escape '\')
那么他会在gp的master节点和segment节点上pg_exttable字典表中都加一条记录表示外表文件的路径。
其中location字段是记录url的比如 "{gpfdist://10.199.111.239:8081/yyw_ext.txt}"
刚建立的时候。master和segment字典表都是一致的。
现在我人为的修改master节点的pg_exttable表。修改location字段使他指向新的地址 ,但是segment的地址不变。
我测试发现。外表的连接地址确实是修改之后的也确实是新的数据。但是现在segment和master的pg_exttable中的值不一致了
不知道会不会有隐藏的坑。然后虽然gpfdist协议是segment并行读取外表文件。但是从测试上来看好像就是用到了master的数据字典
没有用到segment的数据字典。那这个segment上的pg_exttable表有什么作用呢 。我表示奇怪。

阅读 3.3k
1 个回答

首先,我不知道为什么你需要人为地修改master节点的pg_exttable表从而导致master节点和segment节点的数据字典不一致。如果你只是想让external table指向新的位置,你完成可以drop掉旧的external table,然后创建一个名字一样的新的external table,但指向新的位置。

其次,从实现代码看,如你测试的结果所示,gpfdist协议的外部表执行的时候使用的是master节点的数据字典,location的信息通过查询计划分发到segment节点。换句话说,在正常的查询中,gpfdist协议的外部表没有用到segment的数据字典。但是,Greenplum Database有一种模式叫utility模式。用户是可以通过utility模式直接连接到segment节点,然后在segment节点上面执行查询。在这种情况下,如果需要访问gpfdist协议的外部表,那么使用的将是segment的数据字典(也就是segment的pg_exttable中的location信息)。因为utility模式下,每个segment就是一个单独的postgresql数据库,它不会去访问,也不能去访问master的数据字典。

最后,结论就是:(1)你不应该人为地去修改master节点的pg_exttable表;(2)正常情况下,对于gpfdist协议的外部表,即便master和segment的pg_exttable信息不一致,对查询结果也不会有任何影响;但在utility模式下,在master上访问同样的external table,和在segment上访问同样的external table,结果可能会不一样。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进