Cloudera Hue实战：如何高效利用这款数据查询工具

Hue 的介绍

HUE 是一个开源的 Apache Hadoop UI 系统，早期由 Cloudera 开发，它是基于 Python Web 框架 Django 实现，后来贡献给开源社区。它包括 3 个部分 hue ui，hue server， hue db。通过使用 Hue 我们可以通过浏览器方式操纵 Hadoop 集群，查看修改 hdfs 的文件，管理 hive 的元数据，运行 Sqoop，编写 Oozie 工作流等大量工作。Hue 的安装依赖 hive 和 oozie，首先需要安装 Hive 和 oozie。

1.选择集群，添加服务:

添加服务向导: 选择“hue”服务，点击“继续”:

选择依赖的 HDFS，点击“继续”:

角色按照默认配置即可，点击“继续”，完成 hue 的安装。

Hue的使用

以上将 hue 安装在 cm1 节点上，这里登陆 hue 时，地址为:http://cm1:8888，首次登陆 hue 需要登陆 hue 的账号密码，这里输入 user:myhue，password:myhue。最好这里使用 hdfs 用户。因为 hdfs 用户可以操作 hdfs 中的文件，如果使用其他用户只能在当前用户的目录下创建文件。

hue 创建用户点击“管理用户”可以创建用户，并且可以指定权限，是否在 HDFS 中创建主目录。

hue 操作 HDFS 文件可以创建新的文件，也可以修改，最好 HDFS 中大文件不要在 hue 中操作。hue 中的用户默认是进入当前用户的主目录进行操作。3. hue 操作 hive 中的数据登录 hue 之后，点击“Query Editors”->“Hive”，编写 sql 创建 Hive 表:

创建完成后，点击 hive 数据库刷新，可以看到刚才创建的 Hive 表:

创建表完成之后，可以点击“Metastore Manager”，点击刚才创建的表名，可以导入数据，选择的数据可以是 HDFS 中也可以是本地中的文件数据:

上传完数据之后，选择上传的数据，导入到表中。点击浏览表中的数据如下:点击“Query Editors”，在查询编辑器中执行查询 sql 语句:

之后 sql 语句之后，hql 转换成 MR 作业，可以点击“Job Browser”查看任务:

点击点击“Query Editors”->“Hive”->“查看结果”，可以看到任务执行的结果:

hue 添加 rdbms 数据库登录 hue 之后，点击“Query Editors”->“DB 查询”，发现没有 rdbms 数据库。

配置关系型数据库步骤如下:进入 CDH，找到 Hue 选项，点击配置:

在配置中搜索“hue_safety_valve.ini”配置项，保存更改，配置如下内容:

1. [librdbms]
2. [[databases]]
3. [[[mysql]]]
4. nice_name="all mysql databases" 
5. engine=mysql
6. host=192.168.179.14
7. port=3306
8. user=root
9. password=123456
10. options={ "init_command":"SET NAMES 'utf8'"}

以上参数中，nice_name 指定在 hue 中显示的连接名称。name 指定连接的 mysql 数据库名称，不指定这个参数，将默认显示全部的数据库。engine 指定 mysql 数据库类型。host 指定数据库地址。port 指定数据库端口号。user 指定连接用户名。password 指定密码。options 中指定的“init_command”指定数据库编码为 utf8，防止有中文时乱码。

以上配置完成之后，重启hue。在 hue webui 中点击“Query Editors”->“DB 查询”，可以看到出现配置的 mysql 数据库。

以上就是今天分享的全部内容

如果你想了解更多关于：Cloudera 系统环境准备、基础环境安装、集群部署以及应用组件安装等全方位的技术的问题，可以后台联系我们在线咨询，我们团队提供 7x24 小时不间断的技术支持服务，确保大家在任何时间遇到问题都能得到及时响应。感谢你的阅读，如果喜欢我的文字，可以持续关注我，会陆续为你更新更多干货小知识。

如果你想深入探讨了解 Cloudera 大数据技术的（内存扩容/缩容策略，故障诊断与问题排查）的方法论，欢迎找我：15928721005

Cloudera Hue实战：如何高效利用这款数据查询工具

Hue 的介绍

Hue的使用

企业任务调度平台

引用和评论

【职业发展】从ETL到大数据：如何规划你的数据职业生涯？

【Hadoop】HBase系统解析及适用场景

【赵渝强老师】史上最详细：Hadoop HDFS的体系架构

【Hadoop】Yarn资源管理调度

NocoBase v1.6.0 正式版发布

【大数据内核解密】HDFS 架构与数据模型：从理论到实战全解析

MPP 架构解析：原理、核心优势与对比指南