2.1 UML 状态机速成教程之一

本贴最后更新于 1030 天前,其中的信息可能已经物是人非

UML 状态机速成教程

真正对我们有帮助的地方是优化 IF-THEN-ELSE 结构。大多数程序一开始的结构都相当好。可随着错误的发现和特性的添加,IF 和 ELSE 也被不断地加进来,一直到没人真正了解数据是如何流经一个函数的。漂亮的打印能帮上些忙,但它无法减少一个嵌套 15 层的 IF 语句的复杂性。

—Jack Ganssle, “Break Points,” ESP Magazine, January 1991

传统的顺序式程序,可以借助循环和嵌套函数调用之类的标准构件,被架构成一个单一的控制流。这样的程序中,大部分的执行上下文是通过程序计数器指针、函数调用树以及堆栈上分配的临时变量来表示的。

而事件驱动式程序则需要一系列细粒度的事件处理函数来响应事件。这些事件处理函数必须快速执行、并总是返回到主事件循环,因此在调用树和程序计数器中无法保留任何上下文。此外,所有的堆栈变量在调用不同的事件处理程序之间都不复存在。所以事件驱动式程序严重依赖静态变量来保存不同事件处理程序调用之间的执行上下文。

因此,事件驱动编程的最大挑战之一,就在于管理以数据形式呈现的执行上下文。主要问题是上下文数据必须能以某种方式反馈回事件处理程序中的代码控制流,以便每个事件处理程序只执行与当前上下文相对应的动作。传统上,这种对上下文的依赖往往会导致深度嵌套的 if-else 结构,后者基于上下文数据(Context Data)来决定控制流。

如果你能消除哪怕是一小部分的条件分支(或者叫 "意大利面条"代码),软件都会变得更容易理解、测试和维护,代码中曲折的执行路径的数量也会急剧下降,而且通常是成数量级的下降。这正是基于状态机的技术的用武之地--通过大幅减少代码中的各种路径,来消除在每个分支点的条件测试。

在这一章中,我简要介绍了 UML 状态机,描述了这些技术在长期演进中的当前状态。给出一个完整的、正式的 UML 状态机讨论不是我的目的,因为 OMG 官方规范里已经[OMG 07]全面地、正式地涵盖了这些内容。相反,我在这一章的目标是通过建立基本术语、介绍基本符号和澄清语义歧义,来为后续的内容打下基础。本章只限于状态机特性中那些可以说是最基本的子集。着重于 UML 状态机在实际、日常编程中的作用,而不是数学抽象。

事件-动作范式的过度简化

目前结构化事件驱动软件的主流方法,是无处不在的 "事件-动作 "范式(Event-Action Paradigm),在这个范式中,事件被直接映射代码,以执行预期的响应。事件-动作范式是理解状态机的重要基石,所以在这一节中,我简单介绍一下它在实践中是如何工作的。

我会使用一个来自图形用户界面(GUI)领域的例子,因为 GUI 是事件驱动系统的典范。在《用状态图构造用户界面》[Horrocks 99]一书中,Ian Horrocks 讨论了一个简单的 GUI 计算器应用程序,该程序作为 Microsoft Visual Basic 的示例程序,发行了数百万份,他在其中发现了一些严重的问题。正如 Horrocks 所指出的那样,这个分析的重点并不是要批评这个特殊的程序,而是要找出其构建中所基于的常规原则的缺点。

当你启动 Visual Basic 计算器(可从配套的网站上获得,在目录******/resources/vb/vccalc.exe 中),你一定会发现,大多数时候它都能正确地进行加、减、乘、除运算(见图 2.1(A))。**

image20210628221655212.png

那有什么不满意的呢?然而,多操作一段时间,你可以发现许多边界条件的情况下,计算器提供错误的结果,冻结,或完全崩溃。

Ian Horrocks 仅经过一个小时的测试,就在 Visual Basic 计算器中发现了 10 个严重错误。试着找出至少一半的错误。

例如,Visual Basic 计算器对 - 事件的响应经常会出问题,只要尝试以下操作顺序。2, -, -, -, -, 2, =. 应用程序就因运行时错误而崩溃(见图 2.1(B))。这是因为同一个按钮( - )具有对一个数字取负值和输入减法运算符两种功能。因此,对"-"按钮点击事件的正确解释取决于其发生时的上下文或模式。同样,CE(取消输入)按钮偶尔也会错误地工作--尝试输入 2,x,CE,3,=,观察到 CE 没有任何效果,尽管它似乎从显示中撤销了 2 的输入。同样,CE 在取消操作数和取消运算符时的表现应该不同。事实证明,无论上下文如何,应用程序处理 CE 事件的方式总是一样的。此时,你可能已经注意到一个新出现的模式。应用程序特别容易受到需要根据上下文进行不同处理的事件的影响

这并非是说 Visual Basic 计算器没尝试去处理上下文。恰恰相反,如果你看一下计算器的代码(可以从网站上的 <qp>/resources/vb/calc.frm 目录中找到),你会发现实际上管理上下文正是这个程序的主要关注点。代码中充斥着大量的全局变量和标志位,它们只有一个目的:处理上下文。例如,DecimalFlag 表示已经输入了一个小数点,OpFlag 表示一个待定的运算,LastInput 表示最后一次按钮按下的事件类型,NumOps 表示操作数,等等。采用这种表示方式,计算的上下文被表达地模糊不清,因此很难准确地判断出应用程序在特定时刻位于哪种模式。实际上,这个程序没有任何单一操作模式的概念,取而代之的是由全局变量和标志的值决定的一、堆紧密耦合并且重叠的运算条件。

代码清单 2.1 显示的条件逻辑中,操作符号事件(+,-,*,和/)的事件处理程序试图确定**-**(减)按钮的点击,是应该被当作取反还是减法。

Listing 2.1 Fragment of Visual Basic code that attempts to determine whether the – (minus) button-click event should be treated as negation or subtraction

Private Sub Operator_Click(Index As Integer)

...

Select Case NumOps 
    Case 0 
        If Operator(Index).Caption = "-" And LastInput <> "NEG" Then 
            ReadOut = "-" & ReadOut 
            LastInput = "NEG" 
        End If 
    Case 1 
        Op1 = ReadOut 
        If Operator(Index).Caption = "-" And LastInput <> "NUMS" And OpFlag <> "=" Then 
            ReadOut = "-" LastInput = "NEG" 
        End If

...

Listing 2.1

清单 2.1 中举例的方法是产生 "边角情形 "行为(也就是 bug)的沃土,原因至少有三。

  1. 它总是导致复杂的条件逻辑(也就是 "意大利面条 "代码)
  2. 在每个分支点都需要评估一个复杂的表达式。
  3. 在不同模式之间的切换需要修改很多变量,从而很容易造成不一致。

像清单 2.1 中呈现的复杂条件表达式,散布在整个代码中,在运行时进行求值从而导致不必要的复杂和性能开销。它们也是出了名的难以搞正确,即便是对是有经验的程序员也是如此,就如那些仍然潜伏在 Visual Basic 计算器中的错误所证明的那样。这种方法很有欺骗性,因为它在最初看起来很好用,但随着问题复杂性的增加,它的代码规模就没办法再上去了。显然,计算器应用程序(总体上只有 7 个事件处理程序和大约 140 行包括注释在内的 Visual Basic 代码)是足够复杂的,以至于很难用这种方法来正确处理。

上面所列举的缺陷,根源在于对事件-动作范式的过度简化。我希望 Visual Basic 计算器的例子能清楚地表明,单一事件本身并不能决定该事件的响应所应执行的动作,至少当前的上下文也同样重要 。然而,流行的事件-动作范式只认识到对事件类型的依赖性,而将上下文的处理很大程度上留给了各种临时技术,这些技术很容易产出为意大利面条代码。

1 操作
li3p 在 2021-06-28 22:45:07 更新了该帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • Q&A

    提问之前请先看《提问的智慧》,好的问题比好的答案更有价值。

    6542 引用 • 29404 回帖 • 245 关注
  • 资讯

    资讯是用户因为及时地获得它并利用它而能够在相对短的时间内给自己带来价值的信息,资讯有时效性和地域性。

    53 引用 • 85 回帖
  • 服务

    提供一个服务绝不仅仅是简单的把硬件和软件累加在一起,它包括了服务的可靠性、服务的标准化、以及对服务的监控、维护、技术支持等。

    41 引用 • 24 回帖 • 4 关注
  • 招聘

    哪里都缺人,哪里都不缺人。

    189 引用 • 1056 回帖 • 3 关注
  • 创造

    你创造的作品可能会帮助到很多人,如果是开源项目的话就更赞了!

    172 引用 • 990 回帖
  • 国际化

    i18n(其来源是英文单词 internationalization 的首末字符 i 和 n,18 为中间的字符数)是“国际化”的简称。对程序来说,国际化是指在不修改代码的情况下,能根据不同语言及地区显示相应的界面。

    7 引用 • 26 回帖 • 1 关注
  • 持续集成

    持续集成(Continuous Integration)是一种软件开发实践,即团队开发成员经常集成他们的工作,通过每个成员每天至少集成一次,也就意味着每天可能会发生多次集成。每次集成都通过自动化的构建(包括编译,发布,自动化测试)来验证,从而尽早地发现集成错误。

    14 引用 • 7 回帖 • 2 关注
  • OpenResty

    OpenResty 是一个基于 NGINX 与 Lua 的高性能 Web 平台,其内部集成了大量精良的 Lua 库、第三方模块以及大多数的依赖项。用于方便地搭建能够处理超高并发、扩展性极高的动态 Web 应用、Web 服务和动态网关。

    17 引用 • 38 关注
  • 黑曜石

    黑曜石是一款强大的知识库工具,支持本地 Markdown 文件编辑,支持双向链接和关系图。

    A second brain, for you, forever.

    10 引用 • 85 回帖 • 1 关注
  • BookxNote

    BookxNote 是一款全新的电子书学习工具,助力您的学习与思考,让您的大脑更高效的记忆。

    笔记整理交给我,一心只读圣贤书。

    1 引用 • 1 回帖
  • 博客

    记录并分享人生的经历。

    270 引用 • 2386 回帖
  • ReactiveX

    ReactiveX 是一个专注于异步编程与控制可观察数据(或者事件)流的 API。它组合了观察者模式,迭代器模式和函数式编程的优秀思想。

    1 引用 • 2 回帖 • 125 关注
  • Mac

    Mac 是苹果公司自 1984 年起以“Macintosh”开始开发的个人消费型计算机,如:iMac、Mac mini、Macbook Air、Macbook Pro、Macbook、Mac Pro 等计算机。

    164 引用 • 594 回帖
  • 以太坊

    以太坊(Ethereum)并不是一个机构,而是一款能够在区块链上实现智能合约、开源的底层系统。以太坊是一个平台和一种编程语言 Solidity,使开发人员能够建立和发布下一代去中心化应用。 以太坊可以用来编程、分散、担保和交易任何事物:投票、域名、金融交易所、众筹、公司管理、合同和知识产权等等。

    34 引用 • 367 回帖 • 2 关注
  • uTools

    uTools 是一个极简、插件化、跨平台的现代桌面软件。通过自由选配丰富的插件,打造你得心应手的工具集合。

    5 引用 • 13 回帖
  • IBM

    IBM(国际商业机器公司)或万国商业机器公司,简称 IBM(International Business Machines Corporation),总公司在纽约州阿蒙克市。1911 年托马斯·沃森创立于美国,是全球最大的信息技术和业务解决方案公司,拥有全球雇员 30 多万人,业务遍及 160 多个国家和地区。

    16 引用 • 53 回帖 • 123 关注
  • MyBatis

    MyBatis 本是 Apache 软件基金会 的一个开源项目 iBatis,2010 年这个项目由 Apache 软件基金会迁移到了 google code,并且改名为 MyBatis ,2013 年 11 月再次迁移到了 GitHub。

    170 引用 • 414 回帖 • 430 关注
  • frp

    frp 是一个可用于内网穿透的高性能的反向代理应用,支持 TCP、UDP、 HTTP 和 HTTPS 协议。

    15 引用 • 7 回帖 • 11 关注
  • Spark

    Spark 是 UC Berkeley AMP lab 所开源的类 Hadoop MapReduce 的通用并行框架。Spark 拥有 Hadoop MapReduce 所具有的优点;但不同于 MapReduce 的是 Job 中间输出结果可以保存在内存中,从而不再需要读写 HDFS,因此 Spark 能更好地适用于数据挖掘与机器学习等需要迭代的 MapReduce 的算法。

    74 引用 • 46 回帖 • 550 关注
  • JVM

    JVM(Java Virtual Machine)Java 虚拟机是一个微型操作系统,有自己的硬件构架体系,还有相应的指令系统。能够识别 Java 独特的 .class 文件(字节码),能够将这些文件中的信息读取出来,使得 Java 程序只需要生成 Java 虚拟机上的字节码后就能在不同操作系统平台上进行运行。

    180 引用 • 120 回帖 • 1 关注
  • Google

    Google(Google Inc.,NASDAQ:GOOG)是一家美国上市公司(公有股份公司),于 1998 年 9 月 7 日以私有股份公司的形式创立,设计并管理一个互联网搜索引擎。Google 公司的总部称作“Googleplex”,它位于加利福尼亚山景城。Google 目前被公认为是全球规模最大的搜索引擎,它提供了简单易用的免费服务。不作恶(Don't be evil)是谷歌公司的一项非正式的公司口号。

    49 引用 • 192 回帖
  • Tomcat

    Tomcat 最早是由 Sun Microsystems 开发的一个 Servlet 容器,在 1999 年被捐献给 ASF(Apache Software Foundation),隶属于 Jakarta 项目,现在已经独立为一个顶级项目。Tomcat 主要实现了 JavaEE 中的 Servlet、JSP 规范,同时也提供 HTTP 服务,是市场上非常流行的 Java Web 容器。

    162 引用 • 529 回帖 • 3 关注
  • 996
    13 引用 • 200 回帖
  • BND

    BND(Baidu Netdisk Downloader)是一款图形界面的百度网盘不限速下载器,支持 Windows、Linux 和 Mac,详细介绍请看这里

    107 引用 • 1281 回帖 • 23 关注
  • HTML

    HTML5 是 HTML 下一个的主要修订版本,现在仍处于发展阶段。广义论及 HTML5 时,实际指的是包括 HTML、CSS 和 JavaScript 在内的一套技术组合。

    103 引用 • 294 回帖
  • WiFiDog

    WiFiDog 是一套开源的无线热点认证管理工具,主要功能包括:位置相关的内容递送;用户认证和授权;集中式网络监控。

    1 引用 • 7 回帖 • 545 关注
  • Ngui

    Ngui 是一个 GUI 的排版显示引擎和跨平台的 GUI 应用程序开发框架,基于
    Node.js / OpenGL。目标是在此基础上开发 GUI 应用程序可拥有开发 WEB 应用般简单与速度同时兼顾 Native 应用程序的性能与体验。

    7 引用 • 9 回帖 • 346 关注