摘要:
Zeppelin做为大数据分析查询工具由于简单易用被广泛使用,本文通过图文的方式说明如何通过Zeppelin查询Greenplum数据。
1.下载
下载Zeppelin 0.5.6 Binary package
2.解压缩程序
$ tar xzf zeppelin-0.5.6-incubating-bin-all.tgz
3.启动Zeppelin服务
$ bin/zeppelin-daemon.sh start
4.访问Zeppelin服务
登录后,如下图所示:
5.配置连接 HashData Warehouse 的解释器
Zeppelin 解释器类似于数据库连接信息,Zeppelin 通过 JDBC 连接 HashData Warehouse 服务。连接配置示例如图 4-2 所示。
参数说明:
postgresql.max.result:结果集最大数量,结果集太大将会占用前端大量的内存。数据分析产生的结果数量一般不多,因此此属性不建议超过1000。
postgresql.user:登陆 HashData Warehouse 的用户名
postgresql.password:用户名密码
postgresql.url:用于定位 HashData Warehouse 服务的连接信息,格式:jdbc:postgresql://主机ip:端口/数据库名
6. 使用Zeppelin创建表,导入数据
Zeppelin 中通过使用 %psql.sql 来指定使用 HashData Warehouse 解释器和语法。图 4-3 给创建一个表,并插入了一些数据。
7.使用Zeppelin进行数据
Zeppelin 可以显示查询结果情况,图 4-4 显示了在不同参数下,COUNT() 聚合函数的不同返回结果。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。