头图

  Flink与Spark一样也是大数据计算引擎,可以完成离线的批处理计算和流处理计算。Flink的优势在它的流处理引擎DataStream。下图展示了Flink的生态圈体系架构。
在这里插入图片描述
  视频讲解如下:
https://www.bilibili.com/video/BV1fn4y197eP/?aid=1055613337&c...

  从下往上可以将Flink的生态圈体系划分成三层,分别是:平台部署层、核心引擎层和API&Library层。下面分别进行介绍。

1、平台部署层

  Flink支持在不同的平台模式进行部署。下表说明了Flink在各种平层模式上进行部署的特点。
在这里插入图片描述

集群模式和Cloud模式都可以用于生产环境,目前主流的部署模式是Cluster on Yarn。

2、核心引擎层

  它是Flink的执行引擎,所有Flink中的计算任务都是这一层执行完成。在部署Flink的时候也是部署的这一层。

3、API & Library层

  这一层主要提供给应用开发人员使用。DataStream API是Flink的流处理模块,并在此基础之上提供了CEP的复杂事件处理机制与数据分析引擎工具Table & SQL;而DataSet API是Flink的批处理模块,基于此API又提供了MLlib机器学习算法的框架、Gelly的图计算框架和数据分析引擎工具Table & SQL。


赵渝强老师
30 声望10 粉丝

20年以上的IT行业从业经历,清华大学计算机软件工程专业毕业,京东大学大数据学院院长,Oracle中国有限公司高级技术顾问;曾在BEA、甲骨文、摩托罗拉等世界500强公司担任高级软件架构师或咨询顾问等要职,精通大...