聊聊计算存储分离

背景

今天看到了云版本的 HBase2.0 上线了，其中使用了计算存储分离。

这里的计算存储分离只是云 Hbase 2.0 中不起眼的一个小细节，但是其做为一种思想，已经用在了绝大多数的云服务中。

这里简单记录一下计算存储分享的实践过程。

发展过程

网络 IO 瓶颈阶段

以前，计算和存储是放在同一台机器上的，计算直接操作本机的存储，来避免网络 IO 对性能的影响。

然后，随着数据量的增加，单机无法提供横向扩展性，因此有了分布式的应用，引入了跨机器复制数据的操作。但是这里的操作原则依然是尽量的本地化，来避免跨节点网络 IO 对性能的影响。

资源使用率瓶颈阶段

当前，数据中心已经有了 25G, 50G 和 100G 的网络，网络 IO 已经不再是瓶颈了。

此时，关注点变为了减少低资源使用率的机器，同时服务可以云化。最终实现初期流量低时，使用少量资源，流量上升后，可以动态增加机器，来扩充服务能力的目标。

怎么实现这个目标呢？即计算存储分离，按需使用资源。

存储端有状态，只存储数据，不处理业务逻辑。
计算端无状态，只处理逻辑，不持久化存储数据。

实现方式

通过学习 HBase 2.0 的架构图，来学习一般的实现方式。

计算存储分离

第一步是实现计算层和存储层的分离。如图所示：

计算层：负责逻辑运算，读写远程的存储
QOS 层：保证数据读写质量，保障性能和安全要求
存储层：通过副本形式保障数据安全，能够容忍单节点的不可用

通过这种方式，实现了按需使用，弹性扩充。

冷热数据分离

第二步是冷热数据分离，分级存储。

这个通常是在实现了第一步的基础上进行的。

即把不常访问的数据放在成本较低的存储上，被访问时延时会稍微高一些，但是也能满足业务需求。

这种方式，最重要是可以实现把读写较快的存储，用来存放对于实时性要求高的数据，来提高性能，同时降低成本。

技术难点

计算存储分离中，有状态的数据均放在了存储层。因此难点都落在了存储层上。

下面是几个常见的方面：

单机 failover

如何保证存储层的高可用性和数据一致性呢？

目前互联网中通用的解决方案是使用 Paxos/raft 强一致性协议，来实现 5 秒级别的 failover 自动恢复。

与一般方案不同的是 Cassandra，其使用的是 gossip 协议来进行节点发现，用户来配置读和写的一致性级别[4]。

毛刺优化

在读写中，常常会遇到毛刺现象，即部分长尾请求的响应时间偏长。一般是网络抖动、磁盘抖动、负载、GC 等原因。

这种情况的解决方法，也是上面提到的解决方法，即使用多数节点读取写入成功时即认为成功的策略(commit majority feature)。

流控

在负载高时，适应降低后台同步服务的资源占用，来降低读写的毛刺。

当然更好的解决方法是，优化后台同步逻辑，来进一步资源占用。

高可用部署

数据至少部署在两个 DC，Zookeeper 类似的服务部署在三个 DC。

参考

MySQL 数据库基本操作（二）

[图片] 数据库的基本操作创建数据库 MySQL 安装完成之后，将会在 data 目录下自动创建几个必须的数据库，可以使用查看数据库的语句查看当前所有存在的数据库，输入的语句如下： SHOW DATABASES; 初始时数据库列表中包含 6 个数据库。mysql 是必需的，描述用户的访问权限。创建数据库的基本 SQ ..

存储系统

[图片] 层次化越靠近 cpu 的读写速度更快造价更高例如手机应用程序在辅存中需要先复制调入到主存中才能被 cpu 访问代码程序 cpu 和主存的读写速度不匹配需要一个 cache 来实现高速缓冲主存把可能会频繁使用的内容放到 cache 中使得 cpu 可以处理更快主存和辅存层面由硬件 + 操作系统构成操作 ..

阿里云对象存储

这两天僵住了，分配给我的项目是提前写完了，但是测试样例却不好弄，索性就划着，反而给了我很多时间去学习其他知识。图床很有必要首先 GayHub 本来就不是很稳定，公司网络访问十分 OK，回到家连 ping 都快 ping 不通了， clone 个 repository 真的是玩一年，更别说编辑 blog 了，打开博客 ..

存储（八）—— Partition

[图片] 如果 partition 这个词听起来不是那么亲切，说起其他名字，想必你会更熟悉一些，比如，ES 里面的 shard，HBase 里面的 region，mysql 里面的分库分表，kafka 里面的。。额。。kafka 里面就叫做 partition。partition（数据分片）是一种更加广泛的称呼。 pa ..

存储（二）—— 内存、SSD、磁盘

[图片] 存储介质，硬件始终是一个绕不过去的话题，后悔上学时没好好学计算机原理，进来查阅了不少资料，试着在这里阐述一二，说个大概，难免有误，欢迎指正。比特和 IO 如上一篇《序言》中所说，计算机中的数据都是以 0 和 1 来存储和传输的，所以，无论何种存储方式，其实现原理必然是找到一种可以模拟 0 和 1 这两个比特 ..

solo 博客 - 七牛云改腾讯云图床（对象存储）

solo 博客 - 七牛云改腾讯云图床（对象存储） solo 默认提供七牛云的对象存储，跑去注册发现还要实名，真麻烦。。腾讯云估计大家都实名过了，那顺便就可以用了首先去 github 把 solo 博客源码 clone 到本地 https://github.com/b3log/solo 1.在数据库里插入几个数据 ..

欢迎来到这里！

我们正在构建一个小众社区，大家在这里相互信任，以平等 • 自由 • 奔放的价值观进行分享交流。最终，希望大家能够找到与自己志同道合的伙伴，共同成长。

关于