Cloudera 集群升级 CDH

本贴最后更新于 2220 天前,其中的信息可能已经事过境迁

【原创】
本文作者:Denghui.Zhou,欢迎交流讨论。
原文链接:https://jianwi.com/articles/bigdata/cloudera/cdh_upgrade.html
版权声明:原创不易,转载请注明出处,谢谢!

详细升级步骤见官方文档:[ https://www.cloudera.com/documentation/enterprise/upgrade/topics/ug_cdh_upgrading_top.html ]。

1、升级流程

升级 CDH 集群
升级 CDH 集群步骤图:
升级 CDH 集群步骤图
CDH 升级架构图:
CDH 升级架构图

2、升级预备

检测 HDFS 文件系统,修正报告的问题

hdfs fsck / -includeSnapshots
hdfs dfsadmin -report

登录各节点,检测 HBase 表的一致性

hbase hbck

其它组件的预备详见官方文档:[ https://www.cloudera.com/documentation/enterprise/upgrade/topics/ug_cdh_upgrade_before.html ]。

3、备份

备份各数据库
数据库备份见 Cloudera集群升级Cloudera Manager 一文中的数据库备份章节。

备份 Zookeeper
所有 Zookeeper 实例节点都需要备份

cp -rp /var/lib/zookeeper/ /var/lib/zookeeper-CM6.0.0-CDH5.12

备份 HDFS
如果启用了高可用模式,在各个 JournalNode 节点主机运行如下命令

# journal节点目录,dfs.journalnode.edits.dir:/srv/data1/dfs/jn
cp -rp /srv/data1/dfs/jn /srv/data1/dfs/jn-CM6.0.0-CDH5.12

在各个 NameNode 节点主机运行如下命令

mkdir -p /etc/hadoop/conf.rollback.namenode
cd /var/run/cloudera-scm-agent/process/ && cd `ls -t1 | grep -e "-NAMENODE\$" | head -1`
cp -rp * /etc/hadoop/conf.rollback.namenode/
rm -rf /etc/hadoop/conf.rollback.namenode/log4j.properties
cp -rp /etc/hadoop/conf.cloudera.hdfs/log4j.properties /etc/hadoop/conf.rollback.namenode/

在各个 DataNode 节点主机运行如下命令

mkdir -p /etc/hadoop/conf.rollback.datanode/
cd /var/run/cloudera-scm-agent/process/ && cd `ls -t1 | grep -e "-DATANODE\$" | head -1`
cp -rp * /etc/hadoop/conf.rollback.datanode/
rm -rf /etc/hadoop/conf.rollback.datanode/log4j.properties
cp -rp /etc/hadoop/conf.cloudera.hdfs/log4j.properties /etc/hadoop/conf.rollback.datanode/

如果 HDFS 未启用高可用,备份所有 Secondary NameNode 节点(HDFS 未启用高可用时)

mkdir -p /etc/hadoop/conf.rollback.secondarynamenode/
cd /var/run/cloudera-scm-agent/process/ && cd `ls -t1 | grep -e "-SECONDARYNAMENODE\$" | head -1`
cp -rp * /etc/hadoop/conf.rollback.secondarynamenode/
rm -rf /etc/hadoop/conf.rollback.secondarynamenode/log4j.properties
cp -rp /etc/hadoop/conf.cloudera.hdfs /log4j.properties /etc/hadoop/conf.rollback.secondarynamenode/

备份 HBase
HBase 元数据存于 Zookeeper 元数据中,备份 Zookeeper 即可。

备份 solr
在控制台停止 Solr 服务,然后点击 Backup Solr Configuration Meta-data for Upgrade 按钮开始备份。
备份前确保 HDFS 存在 /user/solr/upgrade_backup 目录

hdfs dfs -mkdir -p /user/solr/upgrade_backup
hdfs dfs -chown -R solr:solr /user/solr

备份 Hue

cp -rp /opt/cloudera/parcels/CDH/lib/hue/app.reg /opt/cloudera/parcels_backup/app.reg-CM6.0.0-CDH5.12

4、升级 CDH

升级 CDH 集群示意图,按提示升级即可:
升级 CDH 集群示意图

  • B3log

    B3log 是一个开源组织,名字来源于“Bulletin Board Blog”缩写,目标是将独立博客与论坛结合,形成一种新的网络社区体验,详细请看 B3log 构思。目前 B3log 已经开源了多款产品:SymSoloVditor思源笔记

    1063 引用 • 3453 回帖 • 203 关注
  • CDH
    7 引用 • 2 回帖
  • 云计算
    78 引用 • 91 回帖 • 1 关注
  • 大数据

    大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

    93 引用 • 113 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...