摘要:
Zeppelin做为大数据分析查询工具由于简单易用被广泛使用,本文通过图文的方式说明如何通过Zeppelin查询Greenplum数据。

1.下载

下载Zeppelin 0.5.6 Binary package

http://zeppelin.apache.org/do...

2.解压缩程序

$ tar xzf zeppelin-0.5.6-incubating-bin-all.tgz

3.启动Zeppelin服务

$ bin/zeppelin-daemon.sh start

4.访问Zeppelin服务

http://yourIP:8080/

登录后,如下图所示:
图片描述

5.配置连接 HashData Warehouse 的解释器

Zeppelin 解释器类似于数据库连接信息,Zeppelin 通过 JDBC 连接 HashData Warehouse 服务。连接配置示例如图 4-2 所示。

图片描述

参数说明:

postgresql.max.result:结果集最大数量,结果集太大将会占用前端大量的内存。数据分析产生的结果数量一般不多,因此此属性不建议超过1000。
postgresql.user:登陆 HashData Warehouse 的用户名
postgresql.password:用户名密码
postgresql.url:用于定位 HashData Warehouse 服务的连接信息,格式:jdbc:postgresql://主机ip:端口/数据库名

6. 使用Zeppelin创建表,导入数据

Zeppelin 中通过使用 %psql.sql 来指定使用 HashData Warehouse 解释器和语法。图 4-3 给创建一个表,并插入了一些数据。

图片描述

7.使用Zeppelin进行数据

Zeppelin 可以显示查询结果情况,图 4-4 显示了在不同参数下,COUNT() 聚合函数的不同返回结果。

图片描述

相关资源


酷克数据HashData
83 声望33 粉丝

酷克数据是中国领先的云原生数据仓库软件公司,致力以领先技术降低大数据分析的门槛和成本,我们发起了CloudberryDB开源项目,企业级数据仓库 HashData Lightning、云数仓HashData Enterprise、AI工具箱HashML,...


引用和评论

0 条评论