CAP 原理
CAP 原理被奉为分布式系统的设计准则. 这是在分布式届无人不知无人不晓的.
- C: Consistency(一致性) 这里的一致性特指的是强一致性, 通俗的讲, 就是所有节点上的数据时时刻刻保持同步. 也就是原子读写. 所有的读写请求都好像是经全局排序过的一样, 写后面的读一定能读到前面写的内容.
- A: Availability(可用性) 任何非故障的节点都应该在有限的时间内给出请求的响应, 这里不关心请求是否成功.
- P: Tolerance to the partition of network(分区容忍性) 当发生网络分区的时候(也就是节点见无法通讯), 在丢失任意多消息的情况下, 系统仍然能够正常的工作.
但是我们也清楚的是在现实的分布式系统中, 三种是不可兼得的. 以下是直观的说明:
AP 满足但 C 不满足 如果既要求系统共可用性又要求分区容错性, 那么就要放弃一致性了. 因为一旦发生网络分区, 节点之间将无法通讯. 为了满足可用性, 没个节点就只能用本地数据进行服务的提供. 这样就会导致数据的不一致.
CP 满足但 A 不满足 如果要求数据在各个服务器上是强一致性的, 然后网络分区了会导致同步时间无限延长, 那么如此一来可用性就得不到保障了.
CA 满足但 P 不满足 如果不存在网络分区, 那么强一致性和可用性是可以满足的.
一致性
什么是一致性? 在分布式存储系统中通常会通过维护多个副本来进行容错, 以此来提高系统的可用性. 但是一致性这个词不管是中文还是英文在计算机的不同领域有着不同的含义:
- Coherence 这个词只出现在 Cache Coherence 中, 其所关注的是多核共享内存的 CPU 架构下, 各个核的 Cache 上的数据应如何保持一致.
- Consensus 是共识, 它强调的是多个提议者就某件事情达成共识, 其所关注的是达成共识的过程, 例如 Paxos, Raft 选举等.
- Consistency 广义上讲, 描述了系统本身的不变量的维护程度对上层业务客户端的影响, 以及该系统的并发状态会向客户端暴露什么样的异常. CAP, ACID 中的 C 都是这个意思.
分布式的一致性通俗的讲就是不同的副本服务器认可同一份数据. 一旦这些服务器对某份数据达成了一致, 那么该决定便是最终决定.
一致性与结果的正确性没有关系, 而是对外呈现的状态是否一致(统一). 例如所有节点都达成一个错误的共识也是一致性的一种表现.
一致性协议解决的正是这样的问题, 它能使的一组机器像一个整体一样工作, 即使其中的一些机器发生了错误, 也能正常的工作.
一致性协议是在复制状态机(Replicated State Machines, RSM)的背景下提出的, 在这之前, 我们先了解一下一致性模型.
###一致性模型
在很多人看来, 银行间的转账应该是强一致性的, 但是仔细分析一下就会发现, 小王向小张转账 1000 元, 小王的账户扣除了 1000 元, 此时小张并一定会同步收到 1000, 可能会存在一个不一致的时间窗口. 也就是小王的账户中扣除了 1000 元, 小张还没收到 1000.
在我们的世界中, 网络分区是任何时刻, 任何地点都有可能正在或者即将发生的. 交换机, 网卡, 主机硬件, 操作系统, 磁盘, 虚拟化层和语言运行时间都会延误, 丢弃, 复制或者重新排序我们的信息. 那么我们需呀直观的正确性去让自己的软件按照确定的规则运行.
欢迎来到这里!
我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。
注册 关于