Cloudera 主机时钟偏差完美解决方案

本贴最后更新于 2394 天前,其中的信息可能已经时移世改

【原创】
本文作者:Denghui.Zhou,欢迎交流讨论。
原文链接:https://jianwi.com/articles/bigdata/cloudera/ntp.html
版权声明:原创不易,转载请注明出处,谢谢!

相关资源分享清单

CDH 集群需要保持各节点时间同步,需要在每个节点配置 NTP 时间同步服务

1、集群配置 NTP 主从时间同步服务

安装 NTP

yum install -y ntp

配置 /etc/ntp.conf 参数
ntp 时钟服务节点:在集群中配置一个 ntp 时间服务器,负责对内网其它节点提供时钟服务。
配置参数说明如下,完整配置脚本见清单中的 server-ntp.conf

# 设置对内网主机提供NTP服务,集群网关是192.168.20.1,允许内网其他机器同步时间 restrict 192.168.20.1 mask 255.255.255.0 nomodify notrap # 指定上层对时的外部服务器,优先选择阿里云的时钟服务 server time6.aliyun.com perfer server 0.cn.pool.ntp.org server 1.cn.pool.ntp.org server 2.cn.pool.ntp.org server 3.cn.pool.ntp.org #允许上层时间服务器主动修改本机时间 restrict time6.aliyun.com nomodify notrap noquery restrict 0.cn.pool.ntp.org nomodify notrap noquery restrict 1.cn.pool.ntp.org nomodify notrap noquery restrict 2.cn.pool.ntp.org nomodify notrap noquery restrict 3.cn.pool.ntp.org nomodify notrap noquery #外部时间服务器不可用时,设置以本地时间作为时间服务 server 127.127.1.0 fudge 127.127.1.0 stratum 10

ntp 子节点:配置参数与 ntp 时钟服务节点同步时间。
配置参数说明如下,完整配置脚本见清单中的 client-ntp.conf

# 指定上层对时的外部服务器,192.168.20.30为配置了ntpd时钟服务端的节点IP server 192.168.20.30 perfer server time6.aliyun.com #允许上层时间服务器主动修改本机时间 restrict 192.168.20.30 nomodify notrap noquery restrict time6.aliyun.com nomodify notrap noquery # 外部时间服务器不可用时,设置以本地时间作为时间服务 server 127.127.1.0 fudge 127.127.1.0 stratum 10

启用 ntp 服务

systemctl start ntpd systemctl enable ntpd

初始时间同步

ntpdate -u time6.aliyun.com

同步系统时间到硬件

hwclock --systohc

2、节点非正常开机启动时的主机时钟偏差问题解决

问题:在 Cloudera 集群中,节点意外宕机自动重启后,集群持续报告 主机时钟偏差 的告警信息,导致集群内一些服务无法正常提供服务。

原因:经排查测算后找到原因了,在服务器非正常启动后,cloudera-scm-agent 启动时,会检测 ntpd 服务是否启动,如果没有检测到 ntpd ,Cloudera 默认会以 chronyd 作为默认时间服务。然而系统并未配置 chronyd 服务,所以一直会出现 主机时钟偏差 的告警信息,服务器正常启动时不会出现该问题。

解决办法:配置一个自定义服务,保证在启动 cloudera-scm-agent 服务之前已经启动了 ntpd 服务。

**配置 scm-deamon.sh **

#!/bin/bash # Cloudera集群服务守护脚本 logfile=/tmp/scm-deamon.log echo "-----------------------------" >> $logfile 2>&1 /usr/bin/date >> $logfile 2>&1 echo "开始初始化:" >> $logfile 2>&1 /usr/sbin/swapoff -a >> $logfile 2>&1 free >> $logfile 2>&1 /etc/rc.d/init.d/network restart >> $logfile 2>&1 systemctl status network >> $logfile 2>&1 /usr/bin/sleep 3 >> $logfile 2>&1 systemctl restart ntpd >> $logfile 2>&1 systemctl status ntpd >> $logfile 2>&1 /usr/bin/sleep 3 >> $logfile 2>&1 systemctl disable cloudera-scm-agent >> $logfile 2>&1 systemctl restart cloudera-scm-agent >> $logfile 2>&1 systemctl status cloudera-scm-agent >> $logfile 2>&1 /usr/bin/date >> $logfile 2>&1 echo "初始化完成!" >> $logfile 2>&1 echo -e "-----------------------------\n\n" >> $logfile 2>&1

配置 scm-deamon.service 服务

[Unit] Description=Cloudera环境初始化服务 After=network.target remote-fs.target nss-lookup.target [Service] Type=simple ExecStart=/opt/srv/systemd.scripts/scm-deamon.sh [Install] WantedBy=multi-user.target

部署 scm-deamon.service 服务,请参考上述分享的 deploy-scm-deamon.sh 脚本。

  • B3log

    B3log 是一个开源组织,名字来源于“Bulletin Board Blog”缩写,目标是将独立博客与论坛结合,形成一种新的网络社区体验,详细请看 B3log 构思。目前 B3log 已经开源了多款产品:SymSoloVditor思源笔记

    1063 引用 • 3455 回帖 • 159 关注
  • 云计算
    79 引用 • 91 回帖 • 1 关注
  • 大数据

    大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

    93 引用 • 113 回帖
  • 时钟偏差
    1 引用

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • Ant-Design

    Ant Design 是服务于企业级产品的设计体系,基于确定和自然的设计价值观上的模块化解决方案,让设计者和开发者专注于更好的用户体验。

    17 引用 • 23 回帖
  • API

    应用程序编程接口(Application Programming Interface)是一些预先定义的函数,目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力,而又无需访问源码,或理解内部工作机制的细节。

    79 引用 • 431 回帖
  • Gzip

    gzip (GNU zip)是 GNU 自由软件的文件压缩程序。我们在 Linux 中经常会用到后缀为 .gz 的文件,它们就是 Gzip 格式的。现今已经成为互联网上使用非常普遍的一种数据压缩格式,或者说一种文件格式。

    9 引用 • 12 回帖 • 167 关注
  • 反馈

    Communication channel for makers and users.

    121 引用 • 907 回帖 • 273 关注
  • TextBundle

    TextBundle 文件格式旨在应用程序之间交换 Markdown 或 Fountain 之类的纯文本文件时,提供更无缝的用户体验。

    1 引用 • 2 回帖 • 80 关注
  • OpenCV
    15 引用 • 36 回帖 • 6 关注
  • Bootstrap

    Bootstrap 是 Twitter 推出的一个用于前端开发的开源工具包。它由 Twitter 的设计师 Mark Otto 和 Jacob Thornton 合作开发,是一个 CSS / HTML 框架。

    18 引用 • 33 回帖 • 647 关注
  • 京东

    京东是中国最大的自营式电商企业,2015 年第一季度在中国自营式 B2C 电商市场的占有率为 56.3%。2014 年 5 月,京东在美国纳斯达克证券交易所正式挂牌上市(股票代码:JD),是中国第一个成功赴美上市的大型综合型电商平台,与腾讯、百度等中国互联网巨头共同跻身全球前十大互联网公司排行榜。

    14 引用 • 102 回帖 • 317 关注
  • 生活

    生活是指人类生存过程中的各项活动的总和,范畴较广,一般指为幸福的意义而存在。生活实际上是对人生的一种诠释。生活包括人类在社会中与自己息息相关的日常活动和心理影射。

    230 引用 • 1454 回帖 • 1 关注
  • Flume

    Flume 是一套分布式的、可靠的,可用于有效地收集、聚合和搬运大量日志数据的服务架构。

    9 引用 • 6 回帖 • 655 关注
  • 倾城之链
    23 引用 • 66 回帖 • 168 关注
  • 面试

    面试造航母,上班拧螺丝。多面试,少加班。

    325 引用 • 1395 回帖
  • Flutter

    Flutter 是谷歌的移动 UI 框架,可以快速在 iOS 和 Android 上构建高质量的原生用户界面。 Flutter 可以与现有的代码一起工作,它正在被越来越多的开发者和组织使用,并且 Flutter 是完全免费、开源的。

    39 引用 • 92 回帖 • 4 关注
  • 以太坊

    以太坊(Ethereum)并不是一个机构,而是一款能够在区块链上实现智能合约、开源的底层系统。以太坊是一个平台和一种编程语言 Solidity,使开发人员能够建立和发布下一代去中心化应用。 以太坊可以用来编程、分散、担保和交易任何事物:投票、域名、金融交易所、众筹、公司管理、合同和知识产权等等。

    34 引用 • 367 回帖
  • Ruby

    Ruby 是一种开源的面向对象程序设计的服务器端脚本语言,在 20 世纪 90 年代中期由日本的松本行弘(まつもとゆきひろ/Yukihiro Matsumoto)设计并开发。在 Ruby 社区,松本也被称为马茨(Matz)。

    7 引用 • 31 回帖 • 248 关注
  • 书籍

    宋真宗赵恒曾经说过:“书中自有黄金屋,书中自有颜如玉。”

    78 引用 • 396 回帖
  • OpenResty

    OpenResty 是一个基于 NGINX 与 Lua 的高性能 Web 平台,其内部集成了大量精良的 Lua 库、第三方模块以及大多数的依赖项。用于方便地搭建能够处理超高并发、扩展性极高的动态 Web 应用、Web 服务和动态网关。

    17 引用 • 53 关注
  • Caddy

    Caddy 是一款默认自动启用 HTTPS 的 HTTP/2 Web 服务器。

    12 引用 • 54 回帖 • 177 关注
  • Hibernate

    Hibernate 是一个开放源代码的对象关系映射框架,它对 JDBC 进行了非常轻量级的对象封装,使得 Java 程序员可以随心所欲的使用对象编程思维来操纵数据库。

    39 引用 • 103 回帖 • 727 关注
  • Angular

    AngularAngularJS 的新版本。

    26 引用 • 66 回帖 • 550 关注
  • RESTful

    一种软件架构设计风格而不是标准,提供了一组设计原则和约束条件,主要用于客户端和服务器交互类的软件。基于这个风格设计的软件可以更简洁,更有层次,更易于实现缓存等机制。

    30 引用 • 114 回帖 • 7 关注
  • 锤子科技

    锤子科技(Smartisan)成立于 2012 年 5 月,是一家制造移动互联网终端设备的公司,公司的使命是用完美主义的工匠精神,打造用户体验一流的数码消费类产品(智能手机为主),改善人们的生活质量。

    4 引用 • 31 回帖
  • JWT

    JWT(JSON Web Token)是一种用于双方之间传递信息的简洁的、安全的表述性声明规范。JWT 作为一个开放的标准(RFC 7519),定义了一种简洁的,自包含的方法用于通信双方之间以 JSON 的形式安全的传递信息。

    20 引用 • 15 回帖 • 22 关注
  • AWS
    11 引用 • 28 回帖 • 6 关注
  • Eclipse

    Eclipse 是一个开放源代码的、基于 Java 的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。

    76 引用 • 258 回帖 • 629 关注
  • 房星科技

    房星网,我们不和没有钱的程序员谈理想,我们要让程序员又有理想又有钱。我们有雄厚的房地产行业线下资源,遍布昆明全城的 100 家门店、四千地产经纪人是我们坚实的后盾。

    6 引用 • 141 回帖 • 591 关注
  • 学习

    “梦想从学习开始,事业从实践起步” —— 习近平

    174 引用 • 540 回帖