搭建高可用 mongodb 集群(副本集)

本贴最后更新于 2673 天前,其中的信息可能已经沧海桑田

先提出以下几个问题:

  • 主节点挂了能否自动切换连接?目前需要手工切换。
  • 主节点的读写压力过大如何解决?
  • 从节点每个上面的数据都是对数据库全量拷贝,从节点压力会不会过大?
  • 数据压力大到机器支撑不了的时候能否做到自动扩展?

这篇文章看完这些问题就可以搞定了。NoSQL 的产生就是为了解决大数据量、高扩展性、高性能、灵活数据模型、高可用性。但是光通过主从模式的架构远远达不到上面几点,由此 MongoDB 设计了副本集和分片的功能。这篇文章主要介绍副本集

mongoDB 官方已经不建议使用主从模式了,替代方案是采用副本集的模式,点击查看 ,如图:

那什么是副本集呢?打魔兽世界总说打副本,其实这两个概念差不多一个意思。游戏里的副本是指玩家集中在高峰时间去一个场景打怪,会出现玩家暴多怪物少的情况,游戏开发商为了保证玩家的体验度,就为每一批玩家单独开放一个同样的空间同样的数量的怪物,这一个复制的场景就是一个副本,不管有多少个玩家各自在各自的副本里玩不会互相影响。 mongoDB 的副本也是这个,主从模式其实就是一个单副本的应用,没有很好的扩展性和容错性。而副本集具有多个副本保证了容错性,就算一个副本挂掉了还有很多副本存在,并且解决了上面第一个问题“主节点挂掉了,整个集群内会自动切换”。难怪 mongoDB 官方推荐使用这种模式。我们来看看 mongoDB 副本集的架构图:

由图可以看到客户端连接到整个副本集,不关心具体哪一台机器是否挂掉。主服务器负责整个副本集的读写,副本集定期同步数据备份,一但主节点挂掉,副本节点就会选举一个新的主服务器,这一切对于应用服务器不需要关心。我们看一下主服务器挂掉后的架构:

副本集中的副本节点在主节点挂掉后通过心跳机制检测到后,就会在集群内发起主节点的选举机制,自动选举一位新的主服务器。看起来很牛 X 的样子,我们赶紧操作部署一下!
官方推荐的副本集机器数量为至少 3 个,那我们也按照这个数量配置测试。

  • 1.准备两台机器

10.55.15.124、10.55.15.137、10.55.15.178。 10.55.15.124 当作副本集主节点,10.55.15.137、10.55.15.178 作为副本集副本节点。

  • 2.分别在每台机器上建立 mongodb 副本集测试文件夹
#存放整个mongodb文件
mkdir -p /data/mongodb/replset

#存放整个mongodb日志文件
mkdir -p /data/mongodb/replset/logs
 
#存放mongodb数据文件
mkdir -p /data/mongodb/replset/data
 
#进入mongodb文件夹
cd  /data/mongodb
  • 3.安装 mongodb

注意 linux 生产环境不能安装 32 位的 mongodb,因为 32 位受限于操作系统最大 2G 的文件限制(安装步骤略)

  • 4.分别在每台机器上启动 mongodb(两种启动方式)
    • 前台启动
mongod  --dbpath /data/mongodb/replset/data   --replSet replset
    • 后台启动(配置文件方式)
      vim replset.conf
dbpath = /data/mongodb/replset/data/
logpath = /data/mongodb/replset/logs/replset.log
logappend = true
port = 27017 
rest = true
replSet = replset 
fork = true
oplogSize = 4000
directoryperdb = true
nohttpinterface = true
profile = 0 
  • 5.初始化副本集
    在三台机器上任意一台机器登陆 mongodb,这里以 10.55.15.124 为例
mongo 10.55.15.124:27017
 
#使用admin数据库
use admin
#定义副本集配置变量,这里的 _id:”replset” 和上面命令参数“ –replSet replset” 要保持一样。

config = { _id:"replset", members:[
... {_id:0,host:"10.55.15.137:27017"},
... {_id:1,host:"10.55.15.124:27017"},
... {_id:2,host:"10.55.15.178:27016"}]
... }

# 上面未设置优先级,优先级默认都为1,可根据服务器的配置,进行人为添加priority优先级调整
config = { _id:"replset", members:[
... {_id:0,host:"10.55.15.137:27017,priority: 100"},
... {_id:1,host:"10.55.15.124:27017,priority: 70"},
... {_id:2,host:"10.55.15.178:27016,priority: 50"}]
... }

输出:

{
        "_id" : "replset",
        "members" : [
                {
                        "_id" : 0,
                        "host" : "10.55.15.137:27017"
                },
                {
                        "_id" : 1,
                        "host" : "10.55.15.124:27017"
                },
                {
                        "_id" : 2,
                        "host" : "10.55.15.178:27016"
                }
        ]
}
  • 6.初始化副本集配置
rs.initiate(config);
    • 成功输出
{ "ok" : 1 }
    • 失败输出:
{
        "ok" : 0,
        "errmsg" : "replSetInitiate quorum check failed because not all proposed set members responded affirmatively: 10.55.151.137:27017 failed with Couldn't get a connection within the time limit",
        "code" : 74,
        "codeName" : "NodeNotFound"
}
    • 失败解决方案
  • 检查防火墙,是否已放行端口或已关闭;
#RedHat/CentOS 6 查看防火墙状态
 service iptables status
#关闭防火墙
 service iptables stop 
 
# CentOS 7关闭防火墙
 systemctl stop firewalld
  • 防火墙放过端口
vim /etc/sysconfig/iptables
# 在规则最上方加入下面两条规则
-A INPUT -p tcp --destination-port 27017 -m state --state NEW,ESTABLISHED -j ACCEPT
-A OUTPUT -p tcp --source-port 27017 -m state --state ESTABLISHED -j ACCEPT
#  重启防火墙

service iptables restart
  • 检查是不是手贱输错 ip,导致 ip 不在同一局域网
  • 7.检查状态
# 查看副本状态
rs.status()

输出:

{
	"set" : "replset",
	"date" : ISODate("2017-07-27T00:55:15.505Z"),
	"myState" : 1,
	"term" : NumberLong(2),
	"heartbeatIntervalMillis" : NumberLong(2000),
	"members" : [
		{
			"_id" : 0,
			"name" : "10.55.15.137:27017",
			"health" : 1,					# 1 说明是运行正常,没有挂掉,0则说明该节点已经挂掉
			"state" : 2,
			"stateStr" : "SECONDARY",    #SECONDARY说明是副本集副本节点
			"uptime" : 566,
			"optime" : {
				"ts" : Timestamp(1501116356, 1),
				"t" : NumberLong(2)
			},
			"optimeDate" : ISODate("2017-07-27T00:45:56Z"),
			"lastHeartbeat" : ISODate("2017-07-27T00:55:15.081Z"),
			"lastHeartbeatRecv" : ISODate("2017-07-27T00:55:14.126Z"),
			"pingMs" : NumberLong(7),
			"syncingTo" : "10.55.15.124:27017",
			"configVersion" : 1
		},
		{
			"_id" : 1,
			"name" : "10.55.15.124:27017",
			"health" : 1,				# 1 说明是运行正常,没有挂掉,0则说明该节点已经挂掉
			"state" : 1,
			"stateStr" : "PRIMARY",     #PRIMARY说明是副本集主节点
			"uptime" : 593,
			"optime" : {
				"ts" : Timestamp(1501116356, 1),
				"t" : NumberLong(2)
			},
			"optimeDate" : ISODate("2017-07-27T00:45:56Z"),
			"electionTime" : Timestamp(1501116355, 1),
			"electionDate" : ISODate("2017-07-27T00:45:55Z"),
			"configVersion" : 1,
			"self" : true
		},
		{
			"_id" : 2,
			"name" : "10.55.15.178:27016",
			"health" : 1,				    # 1 说明是运行正常,没有挂掉,0则说明该节点已经挂掉
			"state" : 2,
			"stateStr" : "SECONDARY",      #SECONDARY说明是副本集副本节点
			"uptime" : 537,
			"optime" : {
				"ts" : Timestamp(1501116356, 1),
				"t" : NumberLong(2)
			},
			"optimeDate" : ISODate("2017-07-27T00:45:56Z"),
			"lastHeartbeat" : ISODate("2017-07-27T00:55:14.769Z"),
			"lastHeartbeatRecv" : ISODate("2017-07-27T00:55:13.643Z"),
			"pingMs" : NumberLong(2),
			"syncingTo" : "10.55.15.137:27017",
			"configVersion" : 1
		}
	],
	"ok" : 1
}
  • 8.查看配置信息
    rs.conf()

priority 的优先级越高,成为主节点的概率越高,一开始我们没有指定优先级,则优先级默认都为 1,可以根据服务器的配置进行一定的优先级调整(在初始化之前设置)

{
	"_id" : "replset",
	"version" : 1,
	"protocolVersion" : NumberLong(1),
	"members" : [
		{
			"_id" : 0,
			"host" : "10.55.15.137:27017",
			"arbiterOnly" : false,
			"buildIndexes" : true,
			"hidden" : false,
			"priority" : 1,   # 优先级越高,成为主节点的概率越高
			"tags" : {
				
			},
			"slaveDelay" : NumberLong(0),
			"votes" : 1
		},
		{
			"_id" : 1,
			"host" : "10.55.15.124:27017",
			"arbiterOnly" : false,
			"buildIndexes" : true,
			"hidden" : false,
			"priority" : 1,  # 优先级越高,成为主节点的概率越高
			"tags" : {
				
			},
			"slaveDelay" : NumberLong(0),
			"votes" : 1
		},
		{
			"_id" : 2,
			"host" : "10.55.15.178:27016",
			"arbiterOnly" : false,
			"buildIndexes" : true,
			"hidden" : false,
			"priority" : 1,   # 优先级越高,成为主节点的概率越高
			"tags" : {
				
			},
			"slaveDelay" : NumberLong(0),
			"votes" : 1
		}
	],
	"settings" : {
		"chainingAllowed" : true,
		"heartbeatIntervalMillis" : 2000,
		"heartbeatTimeoutSecs" : 10,
		"electionTimeoutMillis" : 10000,
		"getLastErrorModes" : {
			
		},
		"getLastErrorDefaults" : {
			"w" : 1,
			"wtimeout" : 0
		}
	}
}

  • 9.仲裁

在 MongoDB 的副本集群中,还有一个角色叫做仲裁服务器,它的特点是只参与投票选举,而不会同步数据。MongoDB 的配置与其他副本节点服务器相同,同样也要保证没有数据且启用了--replSet 参数。

  • 在 mongodb 与 spring 整合,使用副本集模式时,配置文件中只需配置一个仲裁节点的 ip 及端口即可找到所有节点,不能配置主节点或其他副本节点

我们可以通过下面的步骤来新增一台仲裁服务器。
这里新启动了一个 mongodb 节点(10.55.15.124:27016),连接 mongodb 主节点执行如下操作

use admin
#添加仲裁节点
replset:PRIMARY>rs.addArb("10.55.15.124:27016");

# 查看状态
rs.status();

  • 10.测试
    • 测试主节点和副本节点读写

10.55.15.124:27017 为主节点,可读可写

mongo 10.55.15.124:27017
replset:PRIMARY> use test
switched to db test
replset:PRIMARY> db.user.insert({name:"郑明亮"})
WriteResult({ "nInserted" : 1 })
repset:PRIMARY> db.user.find()
{ "_id" : ObjectId("59787c2825db8cd57a622055"), "name" : "zhangsan" }
{ "_id" : ObjectId("597946f3b4a84b6685e284da"), "name" : "郑明亮" }

10.55.15.178 为副本节点,只读(默认不可读,可先设置 db.getMongo().setSlaveOk(),然后进行可读操作)

mongo 10.55.15.178:17016

replset:SECONDARY> use test
switched to db test

replset:SECONDARY> db.user.insert({name:"郑明亮"})
WriteResult({ "writeError" : { "code" : 10107, "errmsg" : "not master" } })

# 副本节点默认也不可读
replset:SECONDARY> db.user.find().pretty();
Error: error: { "ok" : 0, "errmsg" : "not master and slaveOk=false", "code" : 13435 }
##设置slaveOk为true
db.getMongo().setSlaveOk();
replset:SECONDARY> db.user.find().pretty();
{ "_id" : ObjectId("59787c2825db8cd57a622055"), "name" : "zhangsan" }
{ "_id" : ObjectId("597946f3b4a84b6685e284da"), "name" : "郑明亮" }

    • 模拟主节点故障
  1. 干掉 10.55.15.124:27017 主节点
[root@rocketmq-master1 server]# mongod --shutdown --dbpath=/data/mongodb/replset/data/
killing process with pid: 12975
  1. 干掉后,其他副本节点会说 10.55.15.124 连不上了

  2. 不过此时再登陆可用的这两台 mongodb 其中任意一台,以 10.55.15.137:27017 为例
  3. 查看状态
repset:PRIMARY>rs.status()

让挂掉的节点重新上线后,再查看状态

  • MongoDB

    MongoDB(来自于英文单词“Humongous”,中文含义为“庞大”)是一个基于分布式文件存储的数据库,由 C++ 语言编写。旨在为应用提供可扩展的高性能数据存储解决方案。MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。它支持的数据结构非常松散,是类似 JSON 的 BSON 格式,因此可以存储比较复杂的数据类型。

    90 引用 • 59 回帖 • 1 关注
  • 集群
    29 引用 • 65 回帖 • 1 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • someone

    你的服务器图片有问题

  • someone

    是验证码吧?貌似换了服务器之后就出问题了[em05]

  • someone

    而且反应略慢。

  • someone

    服务器配置有限,没办法啊

推荐标签 标签

  • React

    React 是 Facebook 开源的一个用于构建 UI 的 JavaScript 库。

    192 引用 • 291 回帖 • 384 关注
  • 深度学习

    深度学习(Deep Learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。

    53 引用 • 40 回帖
  • 链滴

    链滴是一个记录生活的地方。

    记录生活,连接点滴

    153 引用 • 3783 回帖 • 1 关注
  • Python

    Python 是一种面向对象、直译式电脑编程语言,具有近二十年的发展历史,成熟且稳定。它包含了一组完善而且容易理解的标准库,能够轻松完成很多常见的任务。它的语法简捷和清晰,尽量使用无异义的英语单词,与其它大多数程序设计语言使用大括号不一样,它使用缩进来定义语句块。

    543 引用 • 672 回帖 • 1 关注
  • Rust

    Rust 是一门赋予每个人构建可靠且高效软件能力的语言。Rust 由 Mozilla 开发,最早发布于 2014 年 9 月。

    58 引用 • 22 回帖
  • DevOps

    DevOps(Development 和 Operations 的组合词)是一组过程、方法与系统的统称,用于促进开发(应用程序/软件工程)、技术运营和质量保障(QA)部门之间的沟通、协作与整合。

    47 引用 • 25 回帖
  • Flume

    Flume 是一套分布式的、可靠的,可用于有效地收集、聚合和搬运大量日志数据的服务架构。

    9 引用 • 6 回帖 • 629 关注
  • Linux

    Linux 是一套免费使用和自由传播的类 Unix 操作系统,是一个基于 POSIX 和 Unix 的多用户、多任务、支持多线程和多 CPU 的操作系统。它能运行主要的 Unix 工具软件、应用程序和网络协议,并支持 32 位和 64 位硬件。Linux 继承了 Unix 以网络为核心的设计思想,是一个性能稳定的多用户网络操作系统。

    943 引用 • 943 回帖
  • DNSPod

    DNSPod 建立于 2006 年 3 月份,是一款免费智能 DNS 产品。 DNSPod 可以为同时有电信、网通、教育网服务器的网站提供智能的解析,让电信用户访问电信的服务器,网通的用户访问网通的服务器,教育网的用户访问教育网的服务器,达到互联互通的效果。

    6 引用 • 26 回帖 • 510 关注
  • 互联网

    互联网(Internet),又称网际网络,或音译因特网、英特网。互联网始于 1969 年美国的阿帕网,是网络与网络之间所串连成的庞大网络,这些网络以一组通用的协议相连,形成逻辑上的单一巨大国际网络。

    98 引用 • 344 回帖
  • Kafka

    Kafka 是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。 这种动作(网页浏览,搜索和其他用户的行动)是现代系统中许多功能的基础。 这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。

    36 引用 • 35 回帖
  • InfluxDB

    InfluxDB 是一个开源的没有外部依赖的时间序列数据库。适用于记录度量,事件及实时分析。

    2 引用 • 71 关注
  • GitBook

    GitBook 使您的团队可以轻松编写和维护高质量的文档。 分享知识,提高团队的工作效率,让用户满意。

    3 引用 • 8 回帖 • 4 关注
  • IDEA

    IDEA 全称 IntelliJ IDEA,是一款 Java 语言开发的集成环境,在业界被公认为最好的 Java 开发工具之一。IDEA 是 JetBrains 公司的产品,这家公司总部位于捷克共和国的首都布拉格,开发人员以严谨著称的东欧程序员为主。

    180 引用 • 400 回帖
  • Elasticsearch

    Elasticsearch 是一个基于 Lucene 的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于 RESTful 接口。Elasticsearch 是用 Java 开发的,并作为 Apache 许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。

    117 引用 • 99 回帖 • 211 关注
  • 尊园地产

    昆明尊园房地产经纪有限公司,即:Kunming Zunyuan Property Agency Company Limited(简称“尊园地产”)于 2007 年 6 月开始筹备,2007 年 8 月 18 日正式成立,注册资本 200 万元,公司性质为股份经纪有限公司,主营业务为:代租、代售、代办产权过户、办理银行按揭、担保、抵押、评估等。

    1 引用 • 22 回帖 • 762 关注
  • 数据库

    据说 99% 的性能瓶颈都在数据库。

    340 引用 • 708 回帖
  • 博客

    记录并分享人生的经历。

    273 引用 • 2388 回帖
  • SVN

    SVN 是 Subversion 的简称,是一个开放源代码的版本控制系统,相较于 RCS、CVS,它采用了分支管理系统,它的设计目标就是取代 CVS。

    29 引用 • 98 回帖 • 680 关注
  • AngularJS

    AngularJS 诞生于 2009 年,由 Misko Hevery 等人创建,后为 Google 所收购。是一款优秀的前端 JS 框架,已经被用于 Google 的多款产品当中。AngularJS 有着诸多特性,最为核心的是:MVC、模块化、自动化双向数据绑定、语义化标签、依赖注入等。2.0 版本后已经改名为 Angular。

    12 引用 • 50 回帖 • 474 关注
  • 音乐

    你听到信仰的声音了么?

    60 引用 • 511 回帖
  • 前端

    前端技术一般分为前端设计和前端开发,前端设计可以理解为网站的视觉设计,前端开发则是网站的前台代码实现,包括 HTML、CSS 以及 JavaScript 等。

    247 引用 • 1348 回帖
  • Tomcat

    Tomcat 最早是由 Sun Microsystems 开发的一个 Servlet 容器,在 1999 年被捐献给 ASF(Apache Software Foundation),隶属于 Jakarta 项目,现在已经独立为一个顶级项目。Tomcat 主要实现了 JavaEE 中的 Servlet、JSP 规范,同时也提供 HTTP 服务,是市场上非常流行的 Java Web 容器。

    162 引用 • 529 回帖
  • ZooKeeper

    ZooKeeper 是一个分布式的,开放源码的分布式应用程序协调服务,是 Google 的 Chubby 一个开源的实现,是 Hadoop 和 HBase 的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。

    59 引用 • 29 回帖 • 5 关注
  • Ant-Design

    Ant Design 是服务于企业级产品的设计体系,基于确定和自然的设计价值观上的模块化解决方案,让设计者和开发者专注于更好的用户体验。

    17 引用 • 23 回帖
  • 强迫症

    强迫症(OCD)属于焦虑障碍的一种类型,是一组以强迫思维和强迫行为为主要临床表现的神经精神疾病,其特点为有意识的强迫和反强迫并存,一些毫无意义、甚至违背自己意愿的想法或冲动反反复复侵入患者的日常生活。

    15 引用 • 161 回帖
  • 链书

    链书(Chainbook)是 B3log 开源社区提供的区块链纸质书交易平台,通过 B3T 实现共享激励与价值链。可将你的闲置书籍上架到链书,我们共同构建这个全新的交易平台,让闲置书籍继续发挥它的价值。

    链书社

    链书目前已经下线,也许以后还有计划重制上线。

    14 引用 • 257 回帖