Storm-Kafka 与配置和代码的集成 - SegmentFault 思否

Storm-Kafka 与配置和代码的集成

发布于 2019-01-08

主要观点：

Apache Storm 是开源、分布式、可靠且容错的系统，有多种应用场景如实时分析等，其处理流数据时包含 Spout 和 Bolt 等组件。
Storm Kafka 集成能使开发者更易处理流数据，Kafka 和 Storm 相互补充，强大合作可实现实时流分析。
KafkaSpout 是从 Kafka 集群读取数据的常规 Spout 实现，需特定参数连接 Kafka 集群，使用 ZooKeeper 存储消息偏移等状态，还可设置相关属性。

关键信息：

Storm 组件：Spout 是流的源，Bolt 处理输入流并可能发出新流。
KafkaSpout 参数：列表的 Kafka 代理、每个主机的分区数、读取的主题、ZooKeeper 中的根路径、存储消费者偏移的 ID 等。
存储偏移：偏移默认存储在 Storm 使用的 ZooKeeper 集群中，可通过配置覆盖，可强制 Spout 回退到以前的偏移等。
运行要求：运行 Kafka 与 Storm 需设置并运行两者集群。

重要细节：

给出了 KafkaSpout 的代码示例，包括初始化配置和相关参数设置。
说明了 KafkaSpout 利用 ZooKeeper 存储消息偏移等状态，以及可设置获取消息的属性。

Storm-Kafka Integration With Configurations and Code

https://dzone.com/articles/storm-kafka-integration-with-configurations-and-co

阅读 22

0 条评论

评论支持部分 Markdown 语法：**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用 @ 来通知其他用户。