Apache Beam访问HDFS
2017-10-08
阅读 4 分钟
2.6k一、直接访问 1.引入HDFS的相关jar包: {代码...} 2.使用HadoopFileSystemOptions代替PipelineOptions {代码...} 3.给Options指定HDFS配置 {代码...} 4.与访问本地文件一样访问HDFS文件 {代码...} 实际测试中发现本地runner(如Direct, Flink Local, Spark Local...)能够成功读写HDFS,但是集群模式下(如Flink Cluster...