如果Spark写出的文件类型为Parquet、Avro或者CSV文件,可以使用gphdfs外部表读入GPDB中。如果是其它文件类型,要麻烦一些,需要定制gphdfs的序列化插件。 http://gpdb.docs.pivotal.io/4...
如果Spark写出的文件类型为Parquet、Avro或者CSV文件,可以使用gphdfs外部表读入GPDB中。如果是其它文件类型,要麻烦一些,需要定制gphdfs的序列化插件。
http://gpdb.docs.pivotal.io/4...