【CDH6】Hue 的安装及使用

Hue 的安装

HUE 是一个开源的 Apache Hadoop UI 系统，早期由 Cloudera 开发，它是基于 Python Web 框架 Django 实现，后来贡献给开源社区。它包括 3 个部分 hue ui，hue server，hue db。通过使用 Hue 我们可以通过浏览器方式操纵 Hadoop 集群，查看修改 hdfs 的文件，管理 hive 的元数据，运行 Sqoop，编写 Oozie 工作流等大量工作。Hue 的安装可以依赖 hive 和 oozie，所以这里先安装了 Hive 和 oozie。

选择集群，添加服务：
添加服务向导：
选择“hue”服务，点击“继续”：

选择依赖，点击“继续”：

角色按照默认配置即可，点击“继续”，完成 hue 的安装

当点击“继续”后，需要给 hue 配置数据库，需要在 cm-s1 节点上连接 mysql，执行创建数据库及分配权限语句：
```
[root@cm-s1 ~]# mysql -hcm-s1 -pAz123456_ -e "create database hue DEFAULT CHARACTER SET utf8;grant all on hue.* TO 'hue'@'%' IDENTIFIED BY 'Az123456_';flush privileges;"
```
在弹出的页面中选择数据库，填写用户名及密码，点击“测试连接”，测试数据库连接成功后，点击“继续”：

等待服务向导完成，点击“继续” -> “完成”，完成 hue 安装

Hue 的使用

以上将 hue 安装在 cm-s1 节点上，这里登陆 hue 时，地址为：http://cm-s1:8889，首次登陆 hue 需要登陆 hue 的账号密码，这里输入 user:myhue，password:myhue。最好这里使用 hdfs 用户。因为 hdfs 用户可以操作 hdfs 中的文件，如果使用其他用户只能在当前用户的目录下创建文件。

hue 创建用户
点击“管理用户”->“添加用户”可以创建用户，并且可以指定权限，是否在 HDFS 中创建主目录等。
hue 操作 HDFS 文件
可以创建新的文件，也可以修改，最好 HDFS 中大文件不要在 hue 中操作。hue 中的用户默认是进入当前用户的主目录进行操作。

点击以上“文件”进入到 HDFS 文件系统，进行创建上传文件夹或者文件，还可以对文件进行编辑。
Hue 操作 hive 中的数据
登录 hue 之后，点击“查询” -> “编辑器” -> “Hive”，编写 SQL 创建 Hive 表：

创建完成后，点击 hive 数据库刷新，可以看到刚才创建的 Hive 表,创建表完成之后，可以右键表找到“在浏览器中打开”，可以查询、导入、删除表等操作，导入数据时选择的数据可以是 HDFS 中也可以是本地中的文件数据：

点击“提交”将 HDFS 中文件数据导入到表中。点击“查询”查询表中的数据，如下：

在 Hive SQL 面板中还可以查询数据，在查询编辑器中执行查询 sql 语句：

执行 sql 语句之后，hql 转换成 MR 作业，可以点击“作业”查看任务：
Hue 添加 RDBMS 数据库
hue 也支持 RDBMS 关系数据库的展示及操作。启动 Cloudera Manager 登录 Hue 之后，在配置中搜索“hue_safety_valve.ini”配置项，配置如下内容，保存更改：
```
[librdbms]
[[databases]]
[[[mysql]]]
nice_name="all mysql databases"
engine=mysql
host=cm-s1
port=3306
user=root
password=Az123456_
options={ "init_command":"SET NAMES 'utf8'"}

[notebook]
[[interpreters]]
[[[hive]]]
name=Hive
[[[mysql]]]
name=Mysql
interface=rdbms
[[[java]]]
name=Java
interface=oozie
[[[spark2]]]
name=Spark
interface=oozie
[[[shell]]]
name=Shell
interface=oozie
[[[sqoop1]]]
name=Sqoop1
interface=oozie
[[[distcp]]]
name=Distcp
interface=oozie
```
以上参数中，nice_name 指定在 hue 中显示的连接名称。name 指定连接的 mysql 数据库名称，不指定这个参数，将默认显示全部的数据库。engine 指定 mysql 数据库类型。host 指定数据库地址。port 指定数据库端口号。user 指定连接用户名。password 指定密码。options 中指定的“init_command”指定数据库编码为 utf8，防止有中文时乱码。
此外，在配置“[notebook]”时，可以只需要配置 Hive 与 Mysql 即可。以上配置完成之后，重启 hue。重新进入 hue webui 中，点击“查询”->“编辑器”，可以看到“MySQL”标签，点击在主页右侧“SQL”中也会出现对应的 MySQL 中的数据库及表信息。

【CDH6】Oozie 安装及使用

Oozie 的安装 oozie 是一个基于 Hadoop 的工作流引擎，也叫任务调度器，它以 xml 的形式写调度流程，可以调度 mr、pig、hive、shell、jar 和 spark 等。在工作中如果多个任务之间有依赖执行顺序要求，可以使用 oozie 来进行调度执行。选择集群，添加 oozie 服务 [图片] ..

【CDH6】安装 Hive

安装 Hive 选择集群，添加 Hive 服务[图片][图片] 添加服务向导选择依赖（只有一项可供选择时则默认跳过），点击“继续”，选择默认角色配置即可：[图片] 点击“继续”之后，需要配置 Hive 依赖的 mysql 数据库，需要在 cm-s1 节点上连接 mysql，执行创建数据库及分配权限语句： [root@ ..

CDH 6.3.2 部署

Cloudera Manager 安装系统环境准备，安装基础环境选择四台已经安装 CentOS7 Linux 系统的节点，分配资源。安装 CDH 节点推荐内存为 64G，大部分内存被 Cloudera Management Service 占用，因为做了大量的数据分析和整合。这里，划分四台节点如下：主机名 IP ..

centos7 下安装 CDH5.14.4 的问题汇总

1. cloudera-manager 安装一直卡在了 agent 的服务安装因为 CM 在安装过程中，会检测是否已安装 agent，而 agent 的安装依赖 daemons，没安装的情况下，会在线下载安装，这个过程是非常缓慢的，所以提前下好 cloudera-manager-agent-5.14.4-1.cm51 ..

Cloudera 集群升级 CDH

Cloudera CDH-5.6.1 离线集群搭建（纪念这些天踩进的坑）

关于CDH和Cloudera Manager CDH (Cloudera's Distribution, including Apache Hadoop)，是Hadoop众多分支中的一种，由Cloudera维护，基于稳定版本的Apache Hadoop构建，并集成了很多补丁，可直接用于生产环境。 Cloudera Ma ..

【bigdata】4.hive 安装

hive的全部安装过程都是在master节点安装 hive 1.上传并解压 tar -zxvf apache-hive-1.2.2-bin.tar.gz -C /hive安装目录 2.配置环境 2.1 配置 hive-env.sh # 跳转到hive配置文件目录 cd /hive安装目录/conf # 修改名称 mv ..

欢迎来到这里！

我们正在构建一个小众社区，大家在这里相互信任，以平等 • 自由 • 奔放的价值观进行分享交流。最终，希望大家能够找到与自己志同道合的伙伴，共同成长。

关于

【CDH6】Hue 的安装及使用

Hue 的安装

Hue 的使用

相关帖子

【CDH6】Oozie 安装及使用

【CDH6】安装 Hive

CDH 6.3.2 部署

centos7 下安装 CDH5.14.4 的问题汇总

Cloudera 集群升级 CDH

Cloudera CDH-5.6.1 离线集群搭建（纪念这些天踩进的坑）

【bigdata】4.hive 安装

欢迎来到这里！

近期热议

推荐标签标签

最新标签

【CDH6】Hue 的安装及使用

Hue 的安装

Hue 的使用

相关帖子

【CDH6】Oozie 安装及使用

【CDH6】安装 Hive

CDH 6.3.2 部署

centos7 下安装 CDH5.14.4 的问题汇总

Cloudera 集群升级 CDH

Cloudera CDH-5.6.1 离线集群搭建（纪念这些天踩进的坑）

【bigdata】4.hive 安装

欢迎来到这里！

近期热议

推荐标签 标签

最新标签

推荐标签标签