大数据最后一公里——2021年五大开源数据可视化BI方案对比

个人非常喜欢这种说法,最后一公里不是说目标全部达成,而是把整个路程从头到尾走了一遍。

大数据在经过前几年的野蛮生长以后,开始与数据中台的概念一同向着更实际的方向落地。有人问,数据可视化是不是等同于数据大屏。数据大屏是数据可视化的一部分,其承载更多的是展示与监控的功能。

而真正对业务产生影响的,确是比较低调的自助数据可视化系统(商用的一般称之为BI系统),支撑着公司的指标体系,为业务的发展,企业的数字化驱动提供帮助。

本文将对比Superset,Redash,Metabase,Davinci,DataEase五大开源的数据可视化分析工具。

商用方案不在此次讨论之中。将这些开源的数据可视化分析工具用好,用熟练。并在其基础上进行二次开发,形成与公司业务密切结合的技术方案,并随着公司业务的发展不断的改进,是让大数据落地的一个不错的选择。

Superset

Superset是由 Airbnb 开源的数据探索与可视化平台。

官网地址:https://superset.apache.org/

源代码库:https://github.com/apache/sup...

目前最新的release版本为1.3.0。社区活跃,颜值较高。

支持丰富的数据源。

提供了五十多种图表的支持,如丰富的分布,趋势,相关性图表,并且支持如Echarts等插件的方式自定义图表。

Redash

Redash 是一个可协作数据可视化和仪表板平台,旨在使用更简单的方式(SQL)进行数据可视化。

支持超过 35 个 SQL 和 NoSQL的数据源。

支持线形,饼形,漏斗,地图,旭日,词云等十几种图表。

官网地址:https://blog.redash.io/

源代码库:https://github.com/getredash/...

2020 年 6 月 24 日 redash宣布被 Databricks(Spark,Delta Lake所属公司)收购。相信未来会发展的越来越好。

Metabase

metabase是一款开源的BI分析工具,开发语言clojure+js为主、也有高阶的收费版。

从设计理念上来说,metabase更注重非技术人员的使用体验。

官网地址:https://www.metabase.com/

源代码库:https://github.com/metabase/m...

Davinci

Davinci是一个DVAAS(Data Visualization as a Service)平台解决方案。

Davinci是一款国产的开源数据可视化工具。由宜信数据团队开源。

官网文档地址:https://edp963.github.io/davi...

源代码库:https://github.com/edp963/dav...

DataEase

DataEase 是开源的数据可视化分析工具,帮助用户快速分析数据并洞察业务趋势,从而实现业务的改进与优化。DataEase 支持丰富的数据源连接,能够通过拖拉拽方式快速制作图表,并可以方便的与他人分享。

源代码库:https://github.com/dataease/d...

以上五大方案均为相对成熟的开源技术方案,但是各有千秋,选择最适合自己公司的方案才是最重要的。

欢迎关注 大数据流动 加入Superset学习交流群,大家共同学习进步。

更多大数据相关技术与方案实践,欢迎关注 大数据流动


大数据流动
公号 大数据流动

公号 大数据流动。专注于实时计算,数据治理,数据可视化相关技术与应用。

32 声望
7 粉丝
0 条评论
推荐阅读
未来已来!华为《智能世界2030》报告解读(附下载)
近日华为发布了《智能世界2030》报告,探索未来十年的趋势。华为汪涛以“无界探索,翻开未来”为主题演讲。本文带大家来看一下这份124页的报告主要讲了什么内容,同时也关注下和大数据发展的关系。

大数据流动阅读 2.4k

基于 Flink 流计算实现的股票交易实时资产应用
本次赛题思路源自于真实工作场景的一个线上项目,该项目在经过一系列优化后已稳定上线,在该项目开发的过程中数据平台组和技术负责人提供了许多资源和指导意见,而项目的结果也让我意识到了流计算在实际生产中优...

ApacheFlink1阅读 497

封面图
国产 ETL 工具 etl-engine 流批一体数据交换系统 轻量级 跨平台 引擎
产品概述我们不仅仅是数据的搬运工,还是数据搬运过程中加工处理的工厂。我们不仅仅适用关系型数据库中,还适配当下流行的时序数据库、消息中间件、Hadoop生态中,支持多种类型数据库之间的融合查询及流式计算。e...

weigeonlyyou阅读 955

封面图
在毫秒量级上做到“更快”!DataTester 助力飞书提升页面秒开率
对飞书而言,用户体验旅程从打开产品页面的一瞬间就已开始,这里有一个十分重要的指标——页面秒开率,秒开率是指页面在一秒之内打开的比率。为了能够持续吸引用户,一款产品则至少需要在 1000 毫秒以内呈现出交互...

字节跳动数据平台阅读 888

封面图
Flink SQL 的数据脱敏解决方案
Flink SQL 的数据脱敏解决方案,支持面向用户级别的数据脱敏访问控制,即特定用户只能访问到脱敏后的数据。此方案是实时领域Flink的解决思路,类似于离线数仓 Hive 中 Ranger Column Masking 方案。

ApacheFlink1阅读 378

数据可视化大屏的页面布局以及自适应
在做数据可视化大屏之前,我们需要考虑到页面的布局问题以及页面缩放自适应问题,下面分别就这两个方面讲解。页面布局类似这种页面区块的明显划分,常用的布局方式有两种:1、flex布局2、grid布局grid布局grid布...

兔子先森阅读 792

echarts数据可视化-动态柱状图
效果如下:此处用的echarts柱状图为:Axis Align with Tick本文的要讨论的内容:1、柱状图样式修改2、多数据的缩放展示

兔子先森阅读 781

公号 大数据流动。专注于实时计算,数据治理,数据可视化相关技术与应用。

32 声望
7 粉丝
宣传栏