【赵渝强老师】Flink生态圈组件

Flink与Spark一样也是大数据计算引擎，可以完成离线的批处理计算和流处理计算。Flink的优势在它的流处理引擎DataStream。下图展示了Flink的生态圈体系架构。
在这里插入图片描述
视频讲解如下：
https://www.bilibili.com/video/BV1fn4y197eP/?aid=1055613337&c...

从下往上可以将Flink的生态圈体系划分成三层，分别是：平台部署层、核心引擎层和API&Library层。下面分别进行介绍。

1、平台部署层

Flink支持在不同的平台模式进行部署。下表说明了Flink在各种平层模式上进行部署的特点。
在这里插入图片描述

集群模式和Cloud模式都可以用于生产环境，目前主流的部署模式是Cluster on Yarn。

2、核心引擎层

它是Flink的执行引擎，所有Flink中的计算任务都是这一层执行完成。在部署Flink的时候也是部署的这一层。

3、API & Library层

这一层主要提供给应用开发人员使用。DataStream API是Flink的流处理模块，并在此基础之上提供了CEP的复杂事件处理机制与数据分析引擎工具Table & SQL；而DataSet API是Flink的批处理模块，基于此API又提供了MLlib机器学习算法的框架、Gelly的图计算框架和数据分析引擎工具Table & SQL。

【赵渝强老师】Flink生态圈组件

1、平台部署层

2、核心引擎层

3、API & Library层

赵渝强老师

引用和评论

【赵渝强老师】使用obd快速体验OceanBase

【Hadoop】HDFS架构解析

【Hadoop】HBase系统解析及适用场景

基于 pyflink 的算法工作流设计和改造

MCP+Hologres+LLM 搭建数据分析 Agent

某全球领先网络解决方案提供商基于 Apache Doris 统一 Trino、Pinot、Iceberg、Kyuubi技术栈

SelectDB 实时分析性能突出，宝舵成本锐减与性能显著提升的双赢之旅

【赵渝强老师】Flink生态圈组件

1、平台部署层

2、核心引擎层

3、API & Library层

赵渝强老师

引用和评论

【赵渝强老师】使用obd快速体验OceanBase

【Hadoop】HDFS架构解析

【Hadoop】HBase系统解析及适用场景

基于 pyflink 的算法工作流设计和改造

MCP+Hologres+LLM 搭建数据分析 Agent

某全球领先网络解决方案提供商 基于 Apache Doris 统一 Trino、Pinot、Iceberg、Kyuubi技术栈

SelectDB 实时分析性能突出，宝舵成本锐减与性能显著提升的双赢之旅

某全球领先网络解决方案提供商基于 Apache Doris 统一 Trino、Pinot、Iceberg、Kyuubi技术栈