2.1 UML 状态机速成教程之一

本贴最后更新于 1100 天前,其中的信息可能已经物是人非

UML 状态机速成教程

真正对我们有帮助的地方是优化 IF-THEN-ELSE 结构。大多数程序一开始的结构都相当好。可随着错误的发现和特性的添加,IF 和 ELSE 也被不断地加进来,一直到没人真正了解数据是如何流经一个函数的。漂亮的打印能帮上些忙,但它无法减少一个嵌套 15 层的 IF 语句的复杂性。

—Jack Ganssle, “Break Points,” ESP Magazine, January 1991

传统的顺序式程序,可以借助循环和嵌套函数调用之类的标准构件,被架构成一个单一的控制流。这样的程序中,大部分的执行上下文是通过程序计数器指针、函数调用树以及堆栈上分配的临时变量来表示的。

而事件驱动式程序则需要一系列细粒度的事件处理函数来响应事件。这些事件处理函数必须快速执行、并总是返回到主事件循环,因此在调用树和程序计数器中无法保留任何上下文。此外,所有的堆栈变量在调用不同的事件处理程序之间都不复存在。所以事件驱动式程序严重依赖静态变量来保存不同事件处理程序调用之间的执行上下文。

因此,事件驱动编程的最大挑战之一,就在于管理以数据形式呈现的执行上下文。主要问题是上下文数据必须能以某种方式反馈回事件处理程序中的代码控制流,以便每个事件处理程序只执行与当前上下文相对应的动作。传统上,这种对上下文的依赖往往会导致深度嵌套的 if-else 结构,后者基于上下文数据(Context Data)来决定控制流。

如果你能消除哪怕是一小部分的条件分支(或者叫 "意大利面条"代码),软件都会变得更容易理解、测试和维护,代码中曲折的执行路径的数量也会急剧下降,而且通常是成数量级的下降。这正是基于状态机的技术的用武之地--通过大幅减少代码中的各种路径,来消除在每个分支点的条件测试。

在这一章中,我简要介绍了 UML 状态机,描述了这些技术在长期演进中的当前状态。给出一个完整的、正式的 UML 状态机讨论不是我的目的,因为 OMG 官方规范里已经[OMG 07]全面地、正式地涵盖了这些内容。相反,我在这一章的目标是通过建立基本术语、介绍基本符号和澄清语义歧义,来为后续的内容打下基础。本章只限于状态机特性中那些可以说是最基本的子集。着重于 UML 状态机在实际、日常编程中的作用,而不是数学抽象。

事件-动作范式的过度简化

目前结构化事件驱动软件的主流方法,是无处不在的 "事件-动作 "范式(Event-Action Paradigm),在这个范式中,事件被直接映射代码,以执行预期的响应。事件-动作范式是理解状态机的重要基石,所以在这一节中,我简单介绍一下它在实践中是如何工作的。

我会使用一个来自图形用户界面(GUI)领域的例子,因为 GUI 是事件驱动系统的典范。在《用状态图构造用户界面》[Horrocks 99]一书中,Ian Horrocks 讨论了一个简单的 GUI 计算器应用程序,该程序作为 Microsoft Visual Basic 的示例程序,发行了数百万份,他在其中发现了一些严重的问题。正如 Horrocks 所指出的那样,这个分析的重点并不是要批评这个特殊的程序,而是要找出其构建中所基于的常规原则的缺点。

当你启动 Visual Basic 计算器(可从配套的网站上获得,在目录******/resources/vb/vccalc.exe 中),你一定会发现,大多数时候它都能正确地进行加、减、乘、除运算(见图 2.1(A))。**

image20210628221655212.png

那有什么不满意的呢?然而,多操作一段时间,你可以发现许多边界条件的情况下,计算器提供错误的结果,冻结,或完全崩溃。

Ian Horrocks 仅经过一个小时的测试,就在 Visual Basic 计算器中发现了 10 个严重错误。试着找出至少一半的错误。

例如,Visual Basic 计算器对 - 事件的响应经常会出问题,只要尝试以下操作顺序。2, -, -, -, -, 2, =. 应用程序就因运行时错误而崩溃(见图 2.1(B))。这是因为同一个按钮( - )具有对一个数字取负值和输入减法运算符两种功能。因此,对"-"按钮点击事件的正确解释取决于其发生时的上下文或模式。同样,CE(取消输入)按钮偶尔也会错误地工作--尝试输入 2,x,CE,3,=,观察到 CE 没有任何效果,尽管它似乎从显示中撤销了 2 的输入。同样,CE 在取消操作数和取消运算符时的表现应该不同。事实证明,无论上下文如何,应用程序处理 CE 事件的方式总是一样的。此时,你可能已经注意到一个新出现的模式。应用程序特别容易受到需要根据上下文进行不同处理的事件的影响

这并非是说 Visual Basic 计算器没尝试去处理上下文。恰恰相反,如果你看一下计算器的代码(可以从网站上的 <qp>/resources/vb/calc.frm 目录中找到),你会发现实际上管理上下文正是这个程序的主要关注点。代码中充斥着大量的全局变量和标志位,它们只有一个目的:处理上下文。例如,DecimalFlag 表示已经输入了一个小数点,OpFlag 表示一个待定的运算,LastInput 表示最后一次按钮按下的事件类型,NumOps 表示操作数,等等。采用这种表示方式,计算的上下文被表达地模糊不清,因此很难准确地判断出应用程序在特定时刻位于哪种模式。实际上,这个程序没有任何单一操作模式的概念,取而代之的是由全局变量和标志的值决定的一、堆紧密耦合并且重叠的运算条件。

代码清单 2.1 显示的条件逻辑中,操作符号事件(+,-,*,和/)的事件处理程序试图确定**-**(减)按钮的点击,是应该被当作取反还是减法。

Listing 2.1 Fragment of Visual Basic code that attempts to determine whether the – (minus) button-click event should be treated as negation or subtraction

Private Sub Operator_Click(Index As Integer)

...

Select Case NumOps 
    Case 0 
        If Operator(Index).Caption = "-" And LastInput <> "NEG" Then 
            ReadOut = "-" & ReadOut 
            LastInput = "NEG" 
        End If 
    Case 1 
        Op1 = ReadOut 
        If Operator(Index).Caption = "-" And LastInput <> "NUMS" And OpFlag <> "=" Then 
            ReadOut = "-" LastInput = "NEG" 
        End If

...

Listing 2.1

清单 2.1 中举例的方法是产生 "边角情形 "行为(也就是 bug)的沃土,原因至少有三。

  1. 它总是导致复杂的条件逻辑(也就是 "意大利面条 "代码)
  2. 在每个分支点都需要评估一个复杂的表达式。
  3. 在不同模式之间的切换需要修改很多变量,从而很容易造成不一致。

像清单 2.1 中呈现的复杂条件表达式,散布在整个代码中,在运行时进行求值从而导致不必要的复杂和性能开销。它们也是出了名的难以搞正确,即便是对是有经验的程序员也是如此,就如那些仍然潜伏在 Visual Basic 计算器中的错误所证明的那样。这种方法很有欺骗性,因为它在最初看起来很好用,但随着问题复杂性的增加,它的代码规模就没办法再上去了。显然,计算器应用程序(总体上只有 7 个事件处理程序和大约 140 行包括注释在内的 Visual Basic 代码)是足够复杂的,以至于很难用这种方法来正确处理。

上面所列举的缺陷,根源在于对事件-动作范式的过度简化。我希望 Visual Basic 计算器的例子能清楚地表明,单一事件本身并不能决定该事件的响应所应执行的动作,至少当前的上下文也同样重要 。然而,流行的事件-动作范式只认识到对事件类型的依赖性,而将上下文的处理很大程度上留给了各种临时技术,这些技术很容易产出为意大利面条代码。

1 操作
li3p 在 2021-06-28 22:45:07 更新了该帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • Facebook

    Facebook 是一个联系朋友的社交工具。大家可以通过它和朋友、同事、同学以及周围的人保持互动交流,分享无限上传的图片,发布链接和视频,更可以增进对朋友的了解。

    4 引用 • 15 回帖 • 456 关注
  • 笔记

    好记性不如烂笔头。

    306 引用 • 782 回帖
  • Telegram

    Telegram 是一个非盈利性、基于云端的即时消息服务。它提供了支持各大操作系统平台的开源的客户端,也提供了很多强大的 APIs 给开发者创建自己的客户端和机器人。

    5 引用 • 35 回帖 • 1 关注
  • uTools

    uTools 是一个极简、插件化、跨平台的现代桌面软件。通过自由选配丰富的插件,打造你得心应手的工具集合。

    5 引用 • 13 回帖 • 1 关注
  • IPFS

    IPFS(InterPlanetary File System,星际文件系统)是永久的、去中心化保存和共享文件的方法,这是一种内容可寻址、版本化、点对点超媒体的分布式协议。请浏览 IPFS 入门笔记了解更多细节。

    20 引用 • 245 回帖 • 234 关注
  • Openfire

    Openfire 是开源的、基于可拓展通讯和表示协议 (XMPP)、采用 Java 编程语言开发的实时协作服务器。Openfire 的效率很高,单台服务器可支持上万并发用户。

    6 引用 • 7 回帖 • 96 关注
  • 创造

    你创造的作品可能会帮助到很多人,如果是开源项目的话就更赞了!

    175 引用 • 992 回帖 • 1 关注
  • OpenShift

    红帽提供的 PaaS 云,支持多种编程语言,为开发人员提供了更为灵活的框架、存储选择。

    14 引用 • 20 回帖 • 611 关注
  • 反馈

    Communication channel for makers and users.

    124 引用 • 907 回帖 • 210 关注
  • CAP

    CAP 指的是在一个分布式系统中, Consistency(一致性)、 Availability(可用性)、Partition tolerance(分区容错性),三者不可兼得。

    11 引用 • 5 回帖 • 582 关注
  • JWT

    JWT(JSON Web Token)是一种用于双方之间传递信息的简洁的、安全的表述性声明规范。JWT 作为一个开放的标准(RFC 7519),定义了一种简洁的,自包含的方法用于通信双方之间以 JSON 的形式安全的传递信息。

    20 引用 • 15 回帖 • 20 关注
  • CentOS

    CentOS(Community Enterprise Operating System)是 Linux 发行版之一,它是来自于 Red Hat Enterprise Linux 依照开放源代码规定释出的源代码所编译而成。由于出自同样的源代码,因此有些要求高度稳定的服务器以 CentOS 替代商业版的 Red Hat Enterprise Linux 使用。两者的不同在于 CentOS 并不包含封闭源代码软件。

    238 引用 • 224 回帖
  • 生活

    生活是指人类生存过程中的各项活动的总和,范畴较广,一般指为幸福的意义而存在。生活实际上是对人生的一种诠释。生活包括人类在社会中与自己息息相关的日常活动和心理影射。

    229 引用 • 1450 回帖
  • 架构

    我们平时所说的“架构”主要是指软件架构,这是有关软件整体结构与组件的抽象描述,用于指导软件系统各个方面的设计。另外还有“业务架构”、“网络架构”、“硬件架构”等细分领域。

    140 引用 • 441 回帖
  • GitBook

    GitBook 使您的团队可以轻松编写和维护高质量的文档。 分享知识,提高团队的工作效率,让用户满意。

    3 引用 • 8 回帖
  • Thymeleaf

    Thymeleaf 是一款用于渲染 XML/XHTML/HTML5 内容的模板引擎。类似 Velocity、 FreeMarker 等,它也可以轻易的与 Spring 等 Web 框架进行集成作为 Web 应用的模板引擎。与其它模板引擎相比,Thymeleaf 最大的特点是能够直接在浏览器中打开并正确显示模板页面,而不需要启动整个 Web 应用。

    11 引用 • 19 回帖 • 320 关注
  • Spring

    Spring 是一个开源框架,是于 2003 年兴起的一个轻量级的 Java 开发框架,由 Rod Johnson 在其著作《Expert One-On-One J2EE Development and Design》中阐述的部分理念和原型衍生而来。它是为了解决企业应用开发的复杂性而创建的。框架的主要优势之一就是其分层架构,分层架构允许使用者选择使用哪一个组件,同时为 JavaEE 应用程序开发提供集成的框架。

    942 引用 • 1458 回帖 • 117 关注
  • Netty

    Netty 是一个基于 NIO 的客户端-服务器编程框架,使用 Netty 可以让你快速、简单地开发出一个可维护、高性能的网络应用,例如实现了某种协议的客户、服务端应用。

    49 引用 • 33 回帖 • 26 关注
  • HBase

    HBase 是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的 Google 论文 “Bigtable:一个结构化数据的分布式存储系统”。就像 Bigtable 利用了 Google 文件系统所提供的分布式数据存储一样,HBase 在 Hadoop 之上提供了类似于 Bigtable 的能力。

    17 引用 • 6 回帖 • 58 关注
  • WebClipper

    Web Clipper 是一款浏览器剪藏扩展,它可以帮助你把网页内容剪藏到本地。

    3 引用 • 9 回帖 • 2 关注
  • MyBatis

    MyBatis 本是 Apache 软件基金会 的一个开源项目 iBatis,2010 年这个项目由 Apache 软件基金会迁移到了 google code,并且改名为 MyBatis ,2013 年 11 月再次迁移到了 GitHub。

    170 引用 • 414 回帖 • 405 关注
  • Node.js

    Node.js 是一个基于 Chrome JavaScript 运行时建立的平台, 用于方便地搭建响应速度快、易于扩展的网络应用。Node.js 使用事件驱动, 非阻塞 I/O 模型而得以轻量和高效。

    138 引用 • 268 回帖 • 147 关注
  • Solidity

    Solidity 是一种智能合约高级语言,运行在 [以太坊] 虚拟机(EVM)之上。它的语法接近于 JavaScript,是一种面向对象的语言。

    3 引用 • 18 回帖 • 350 关注
  • sts
    2 引用 • 2 回帖 • 162 关注
  • 机器学习

    机器学习(Machine Learning)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

    76 引用 • 37 回帖
  • Git

    Git 是 Linux Torvalds 为了帮助管理 Linux 内核开发而开发的一个开放源码的版本控制软件。

    207 引用 • 358 回帖
  • Mac

    Mac 是苹果公司自 1984 年起以“Macintosh”开始开发的个人消费型计算机,如:iMac、Mac mini、Macbook Air、Macbook Pro、Macbook、Mac Pro 等计算机。

    164 引用 • 594 回帖 • 2 关注