超越Spark,大数据集群计算的生产实践

Spark拥有一个庞大的、不断增长的社区,还有在企业环境中不可或缺的生态系统。这些生态系统提供了不同生产环境案例所需的许多功能。一般来说,Spark应用做的是机器学习算法、日志聚合分析或者商务智能相关的运算,因为它在许多领域都有广泛的应用,包括商务智能、数据仓库、推荐系统、反欺诈等。

本文会介绍Spark核心社区开发的生态系统库,以及ML/MLlib及Spark Streaming的Spark库的具体用法,对于企业的各种用例及框架也进行了说明。

阅读 611
0 条评论