1.问题描述

logstash通过webhdfs插件把数据放入hdfs的时候,发现每行数据的签名都增加了一个时间戳和host字段

2018-12-19T08:30:30.234Z %{host} "128.1.1.2" "GET"

2.资料查找

在网上找了很多资料,描述的都是webhdfs怎么使用,至于使用后的数据格式都没有说

我去github的logstash-plugins下看了一下issues,看到了如下的文章,给出了解决办法

https://github.com/logstash-plugins/logstash-output-webhdfs/issues/25

3.解决办法

通过codec对输出数据进行format

    codec => line {
        format => "%{message}"
    }

沉淀
131 声望3 粉丝