从历史看未来,大规模微服务系统的困境 ---- 基于消息的架构的回归

本贴最后更新于 2477 天前,其中的信息可能已经时移俗易

在大规模分布式系统的架构上,微服务系统是现在很多大型互联网公司的架构方向。

这是一个务实的很好的方向,相对于旧的宏服务来说。

然而,像淘宝这种规模的系统,微服务很容易陷入一个困境,就是 聚合层的扇入扇出过大带来的接口过多复杂爆炸的问题,以及聚合层过小,导致客户端请求域名过多复杂度爆炸的矛盾。

先看下淘宝现在的服务架构图:

jpg

由此图我们可以看出每一个微服务的聚合层都有非常高的扇入,处于中间的聚合层还有很高的扇出。

这就是基于 RPC 的微服务架构的根本缺陷所在。

下面我从几个方面来分析下原因:

RPC 的流行,源于 HTTP/AJAX 在互联网应用中流行,在此之前,更多更大的 IT 系统,诸如电信、银行、军事都是基于消息的。以标准最全规模最大的电信系统为例,全球的电话系统都是基于几套信令标准来互通的。所谓信令也就是控制消息。电信系统的优点是,学院派,一开始就是把问题想清楚,缺点是复杂。所以,在以个人网站起家的诸多互联网巨头带起来的风气里,自然看不到电信系统的影子。而互联网应用,包括电商、O2O、社区等都是采用的 AJAX/RPC 为基础的 SaaS、微服务架构。本质的根源是,互联网应用出身草莽,创业开始头半年,快速上线比架构可演进要重要一千倍。

但是有两个例外,一个是腾讯的 QQ,一个是诸多 PC 客户端网游。由于腾讯 QQ 的创始团队有浓厚的电信背景。而网游追求单服务器高负载能力以降低成本。在互联网初期,服务器能力低下的时代,用 HTTP/AJAX 的网页单服务器带不了多少人在线,不适合低成本高在线人数为追求的 MMORPG 类客户端网游。

从历史我们可以看出,选择什么架构,取决于:速度和成本的折中。

因此,我们应该看到虽然 RPC/微服务似乎成为了互联网的唯一选择,并不是经过深思熟虑的长远考虑,更多的是基于惯性,而这个惯性的起点基于快速上线一个简单 Web 站点的需求。

说了这么多,到底 RPC/微服务 和 消息/信令 系统的架构层面的区别是什么呢?

区别是:有没有在系统每一层固定下所有通过该层的 通讯协议 的细节。

假设,我们有一个 系统 负责提供 算术 功能。

在基于 RPC/微服务的系统中,可能设计是,分两层,对外网关层 叫 算术 Gateway,包装内部 加法 Service、减法 Service、乘法 Service、除法 Service 的所有的接口,对外提供服务。这样设计的结果是,算术 Gateway 的对外的接口非常多,而且要重复下层服务的 Schema。**这就导致了 Gateway 需要知道底层的业务逻辑。**对接口的依赖也是一种依赖,对于网关来说,即便是和微服务云内部的接口构成了依赖关系,也是一个巨大的负担.

在基于消息/信令的系统中,可能涉及是,也有一个算术 Gateway,可以接受 一种类别叫 算术运算的消息。每个消息还有子类别,可能是 加、减、乘、除。 这样的好处是,Gateway 无需理解到子类别的处理逻辑和接口细节,只要知道两点:1. 自己能处理的主消息类型  2. 下层所能处理的子消息类型。如此 Gateway 可以方便的路由消息给下层的消息处理器。这也是电信系统的通用设计方式,每一层信令系统都只针对自己的业务域,信令包含子信令,信令的处理器只要知道能处理对应子信令的消息处理器并不需要了解子信令的 Schema。

在国内的网游,以及交通银行的手机银行系统中,广泛的使用 Erlang/OTP 平台。该平台来自于世界最大的电信设备制造商爱立信。在 Erlang/OTP 中,每个 Process 都是一个 Actor 负责处理自己邮箱的消息。而亚马逊最新的 ServerLess 架构却和二十年前的 Erlang/OTP 架构有异曲同工之妙。

由此可见,ServerLess/Actor/消息/信令,其实有很深的设计渊源,是同一种思想的不同领域实现。本质上就是把消息 Schema 的固化和消息的处理解耦。在 RPC/微服务的架构中,每一层,都必须用某种语言/IDL 唯一缺点的描述自己能处理的消息的全部 Schema。而消息/信令架构天然没这个约束。

以上是从 Schema 的层面分析的区别,从同步和异步的暗示上来说,RPC/微服务架构诱骗开发人员用户同步的思想来设计接口,无端制造出了超时重试导致雪崩、同步阻塞浪费线程等问题。任何一个大型系统天然是异步,任何同步的系统的努力都会随着系统的增大而成本越来越高。异步、非阻塞是大部分消息系统设计背景。这点更加重了 RPC/微服务架构的使用成本。

更糟糕的是,随着系统规模的扩大,很多 RPC/微服务系统发现自己必须存在很多环路调用,但是环路又是 RPC/微服务架构的大敌。为此不得不引入诸如 Kafka 等消息队列来引入异步性,解除环路。于是系统的复杂度 Double。 

为何系统复杂了,就会出现环路,这是因为任何复杂系统必然是一个 图计算 系统,而且 必然是一个 有向有环图。为了把一个有向有环图适配到一个树状的 RPC/微服务架构中,架构师们花费了不少脑力。显然,这是一种巨大的浪费。

以上是从 架构抽象层面 的分析。

另一个角度来说,RPC 的易用性并不比消息高,否则,我们用的终端命令行就应该是函数调用的样式操作,而不是现在的交互会话的样式了。人类更喜欢会话方式。更不用说,在每个『消息』的末尾加上 『&』就可以异步化处理消息的简便表达方式,好理解好使用。

综上所述,人类徘徊了 20 多年的以后,大规模分布式系统的架构来设计又慢慢的回到了 消息/信令 架构。

  • 架构

    我们平时所说的“架构”主要是指软件架构,这是有关软件整体结构与组件的抽象描述,用于指导软件系统各个方面的设计。另外还有“业务架构”、“网络架构”、“硬件架构”等细分领域。

    143 引用 • 442 回帖
  • 消息系统
    1 引用 • 2 回帖
  • 分布式
    80 引用 • 149 回帖 • 4 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • demoj

    "Gateway 需要知道底层的业务逻辑"这一句不是很理解,微服务也是把各个模块给封装了的吧

    1 回复
  • linker via macOS

    就是说 网关 需要知道 后面的微服务 在干啥.
    然而这事是不合理的.
    网关应该是业务无关的.

推荐标签 标签

  • ngrok

    ngrok 是一个反向代理,通过在公共的端点和本地运行的 Web 服务器之间建立一个安全的通道。

    7 引用 • 63 回帖 • 647 关注
  • 代码片段

    代码片段分为 CSS 与 JS 两种代码,添加在 [设置 - 外观 - 代码片段] 中,这些代码会在思源笔记加载时自动执行,用于改善笔记的样式或功能。

    用户在该标签下分享代码片段时需在帖子标题前添加 [css] [js] 用于区分代码片段类型。

    132 引用 • 876 回帖 • 1 关注
  • 支付宝

    支付宝是全球领先的独立第三方支付平台,致力于为广大用户提供安全快速的电子支付/网上支付/安全支付/手机支付体验,及转账收款/水电煤缴费/信用卡还款/AA 收款等生活服务应用。

    29 引用 • 347 回帖
  • 友情链接

    确认过眼神后的灵魂连接,站在链在!

    24 引用 • 373 回帖
  • Kotlin

    Kotlin 是一种在 Java 虚拟机上运行的静态类型编程语言,由 JetBrains 设计开发并开源。Kotlin 可以编译成 Java 字节码,也可以编译成 JavaScript,方便在没有 JVM 的设备上运行。在 Google I/O 2017 中,Google 宣布 Kotlin 成为 Android 官方开发语言。

    19 引用 • 33 回帖 • 75 关注
  • FFmpeg

    FFmpeg 是一套可以用来记录、转换数字音频、视频,并能将其转化为流的开源计算机程序。

    23 引用 • 32 回帖
  • NGINX

    NGINX 是一个高性能的 HTTP 和反向代理服务器,也是一个 IMAP/POP3/SMTP 代理服务器。 NGINX 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的,第一个公开版本 0.1.0 发布于 2004 年 10 月 4 日。

    315 引用 • 547 回帖 • 1 关注
  • TGIF

    Thank God It's Friday! 感谢老天,总算到星期五啦!

    289 引用 • 4492 回帖 • 653 关注
  • FreeMarker

    FreeMarker 是一款好用且功能强大的 Java 模版引擎。

    23 引用 • 20 回帖 • 458 关注
  • Jenkins

    Jenkins 是一套开源的持续集成工具。它提供了非常丰富的插件,让构建、部署、自动化集成项目变得简单易用。

    54 引用 • 37 回帖
  • 国际化

    i18n(其来源是英文单词 internationalization 的首末字符 i 和 n,18 为中间的字符数)是“国际化”的简称。对程序来说,国际化是指在不修改代码的情况下,能根据不同语言及地区显示相应的界面。

    8 引用 • 26 回帖
  • Lute

    Lute 是一款结构化的 Markdown 引擎,支持 Go 和 JavaScript。

    28 引用 • 197 回帖 • 25 关注
  • OneDrive
    2 引用 • 2 关注
  • WiFiDog

    WiFiDog 是一套开源的无线热点认证管理工具,主要功能包括:位置相关的内容递送;用户认证和授权;集中式网络监控。

    1 引用 • 7 回帖 • 606 关注
  • Office

    Office 现已更名为 Microsoft 365. Microsoft 365 将高级 Office 应用(如 Word、Excel 和 PowerPoint)与 1 TB 的 OneDrive 云存储空间、高级安全性等结合在一起,可帮助你在任何设备上完成操作。

    5 引用 • 34 回帖
  • Mobi.css

    Mobi.css is a lightweight, flexible CSS framework that focus on mobile.

    1 引用 • 6 回帖 • 753 关注
  • Follow
    4 引用 • 12 回帖 • 7 关注
  • Q&A

    提问之前请先看《提问的智慧》,好的问题比好的答案更有价值。

    9374 引用 • 42710 回帖 • 113 关注
  • jsoup

    jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据。

    6 引用 • 1 回帖 • 488 关注
  • 知乎

    知乎是网络问答社区,连接各行各业的用户。用户分享着彼此的知识、经验和见解,为中文互联网源源不断地提供多种多样的信息。

    10 引用 • 66 回帖
  • Anytype
    3 引用 • 31 回帖 • 11 关注
  • Oracle

    Oracle(甲骨文)公司,全称甲骨文股份有限公司(甲骨文软件系统有限公司),是全球最大的企业级软件公司,总部位于美国加利福尼亚州的红木滩。1989 年正式进入中国市场。2013 年,甲骨文已超越 IBM,成为继 Microsoft 后全球第二大软件公司。

    107 引用 • 127 回帖 • 359 关注
  • Vim

    Vim 是类 UNIX 系统文本编辑器 Vi 的加强版本,加入了更多特性来帮助编辑源代码。Vim 的部分增强功能包括文件比较(vimdiff)、语法高亮、全面的帮助系统、本地脚本(Vimscript)和便于选择的可视化模式。

    29 引用 • 66 回帖 • 1 关注
  • Spark

    Spark 是 UC Berkeley AMP lab 所开源的类 Hadoop MapReduce 的通用并行框架。Spark 拥有 Hadoop MapReduce 所具有的优点;但不同于 MapReduce 的是 Job 中间输出结果可以保存在内存中,从而不再需要读写 HDFS,因此 Spark 能更好地适用于数据挖掘与机器学习等需要迭代的 MapReduce 的算法。

    74 引用 • 46 回帖 • 567 关注
  • 工具

    子曰:“工欲善其事,必先利其器。”

    295 引用 • 750 回帖
  • CentOS

    CentOS(Community Enterprise Operating System)是 Linux 发行版之一,它是来自于 Red Hat Enterprise Linux 依照开放源代码规定释出的源代码所编译而成。由于出自同样的源代码,因此有些要求高度稳定的服务器以 CentOS 替代商业版的 Red Hat Enterprise Linux 使用。两者的不同在于 CentOS 并不包含封闭源代码软件。

    239 引用 • 224 回帖 • 1 关注
  • ZooKeeper

    ZooKeeper 是一个分布式的,开放源码的分布式应用程序协调服务,是 Google 的 Chubby 一个开源的实现,是 Hadoop 和 HBase 的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。

    59 引用 • 29 回帖 • 2 关注