Hue 的介绍
HUE 是一个开源的 Apache Hadoop UI 系统,早期由 Cloudera 开发,它是基于 Python Web 框架 Django 实现,后来贡献给开源社区。它包括 3 个部分 hue ui,hue server, hue db。通过使用 Hue 我们可以通过浏览器方式操纵 Hadoop 集群,查看修改 hdfs 的 文件,管理 hive 的元数据,运行 Sqoop,编写 Oozie 工作流等大量工作。Hue 的安装依赖 hive 和 oozie,首先需要安装 Hive 和 oozie。
1.选择集群,添加服务:
- 添加服务向导: 选择“hue”服务,点击“继续”:
选择依赖的 HDFS,点击“继续”:
角色按照默认配置即可,点击“继续”,完成 hue 的安装。
Hue的使用
以上将 hue 安装在 cm1 节点上,这里登陆 hue 时,地址为:http://cm1:8888,首次 登陆 hue 需要登陆 hue 的账号密码,这里输入 user:myhue,password:myhue。最 好这里使用 hdfs 用户。因为 hdfs 用户可以操作 hdfs 中的文件,如果使用其他用户只 能在当前用户的目录下创建文件。
- hue 创建用户点击“管理用户”可以创建用户,并且可以指定权限,是否在 HDFS 中创建主目录。
- hue 操作 HDFS 文件可以创建新的文件,也可以修改,最好 HDFS 中大文件不要在 hue 中操作。hue 中的用户默认是进入当前用户的主目录进行操作。3. hue 操作 hive 中的数据登录 hue 之后,点击“Query Editors”->“Hive”,编写 sql 创建 Hive 表:
创建完成后,点击 hive 数据库刷新,可以看到刚才创建的 Hive 表:
创建表完成之后,可以点击“Metastore Manager”,点击刚才创建的表名,可以导入数据,选择的数据可以是 HDFS 中也可以是本地中的文件数据:
上传完数据之后,选择上传的数据,导入到表中。点击浏览表中的数据如下:点击“Query Editors”,在查询编辑器中执行查询 sql 语句:
之后 sql 语句之后,hql 转换成 MR 作业,可以点击“Job Browser”查看任务:
点击点击“Query Editors”->“Hive”->“查看结果”,可以看到任务执行的结果:
- hue 添加 rdbms 数据库登录 hue 之后,点击“Query Editors”->“DB 查询”,发现没有 rdbms 数据库。
配置关系型数据库步骤如下:进入 CDH,找到 Hue 选项,点击配置:
在配置中搜索“hue_safety_valve.ini”配置项,保存更改,配置如下内容:
1. [librdbms]
2. [[databases]]
3. [[[mysql]]]
4. nice_name="all mysql databases"
5. engine=mysql
6. host=192.168.179.14
7. port=3306
8. user=root
9. password=123456
10. options={ "init_command":"SET NAMES 'utf8'"}
以上参数中,nice_name 指定在 hue 中显示的连接名称。name 指定连接的 mysql 数据库名称,不指定这个参数,将默认显示全部的数据库。engine 指定 mysql 数据库类型。host 指定数据库地址。port 指定数据库端口号。user 指定连接用户名。password 指定密码。options 中指定的“init_command”指定数据库 编码为 utf8,防止有中文时乱码。
以上配置完成之后,重启hue。在 hue webui 中点击“Query Editors”->“DB 查询”,可以看到出现配置的 mysql 数据库。
以上就是今天分享的全部内容
如果你想了解更多关于:Cloudera 系统环境准备、基础环境安装、集群部署以及应用组件安装等全方位的技术的问题,可以后台联系我们在线咨询,我们团队提供 7x24 小时不间断的技术支持服务,确保大家在任何时间遇到问题都能得到及时响应。感谢你的阅读,如果喜欢我的文字,可以持续关注我,会陆续为你更新更多干货小知识。
如果你想深入探讨了解 Cloudera 大数据技术的(内存扩容/缩容策略,故障诊断与问题排查)的方法论,欢迎找我:15928721005
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。