锁?不锁?如何锁?

本贴最后更新于 2464 天前,其中的信息可能已经天翻地覆

加锁、解锁(同步/互斥)是多线程中非常基本的操作,但我却看到不少的代码对它们处理的很不好。简单说来有三类问题,一是加锁范围太大,虽然避免了逻辑错误,但锁了不该锁的东西,难免降低程序的效率;二是该锁的不锁,导致各种莫名其妙的错误;三是加锁方式不合适,该用临界区的用内核对象等,也会降低程序的效率。

要正确的运用锁操作,首先要弄清楚什么时候需要加锁。很多书上都说在可能“同时发生多个写操作”或“同时发生读写操作”时,应该加锁。这固然没什么错,但我认为它没有说到问题的根上,更准确的表述应该是:如果不加锁会导致不可容忍的数据不一致,那么就应该加锁。据此,我在下表中列出了多线程中应该加锁和无需加锁的条件,其中的“简单数据类型”是指 cpu 可以在一条指令中完成操作的数据类型,一般整形和所有比整形小的数据类型都是,除此之外的类型都属于“复杂数据类型”,例如你自己定义的结构体等。

操作的结果与初值无关 操作的结果与初值相关
写简单数据类型 不需要加锁 ① 需要加锁 ②
写复杂数据类型 需要加锁 ③ 需要加锁 ④
读简单数据类型 不需要加锁 ⑤ 不需要加锁 ⑥
读复杂数据类型 需要加锁 ⑦ 需要加锁 ⑧

大家可能注意到,在第 1、5、6 种情况下,我认为可以不加锁,粗看起来,这与书上的说法有些矛盾。其实却不然,因为这些操作可以在一条指令内完成,所以它们具有天然的“原子性”,我们可以认为 cpu 已经给它们加锁了,我们没必要再画蛇添足。如果这个理由还不够的话,你不妨想一下我们再加一次锁是否有用,看下面的代码(以第 1 种情况为例):

Lock(); // ①
n = 10; // ②
Unlock(); // ③
int x = n; // ④

看出来了吗?不管语句 ①③ 是否存在,这段代码执行完毕后,我们都无法保证 x 的值是 10。也许你会想如果把 ③④ 两条语句的位置换一下,x 就肯定是 10 了。可是在这个例子中,想让 x 是 10,为什么不把语句 ④ 直接换成 int x = 10; 呢?既省了加锁,又减少了键盘的磨损,何乐而不为?!而且,我的这个例子并不是刻意构造的,在多线程,这种情况比比皆是。

第 2 种情况的典型代表是 i++;,需要对它加锁是因为它表面上虽然只有一条语句,却要执行至少两个操作,一是读出 i 的初始,二是把加一后的结果写回去,两个操作就没有“原子性”了,所以需要加锁。

另外,上表中判断是否需要加锁的依据是“是否可能造成数据不一致”。实际上,有些情况下数据不一致是可以容忍的,如果它发生概率极低、造成的不良后果可以忽略、并能很快自动恢复,那它可能就是可以容忍的。对这种数据不一致,我们可以不加锁。不过对它的判定与程序的实际情况关联太大,我们在这里就不讨论了。

加锁的方法也可分为三类,临界区、内核对象和互锁函数。相比前两类,互锁函数的知名度要低不少,但它却是我用的最多的方法,因为它有一个最大的优点:快!有不少书上比较临界区和内核对象时都说临界区的优点是不会进入内核模式,速度快。不过这是不全面的,如果没有冲突(实际发生冲突的概率一般很低),临界区确实不会进内核模式,但如果发生了冲突要进行等待,它就要依靠内核对象了。而互锁函数则绝不会进内核模式,所以互锁函数是最快的(临界区在没有冲突时的行为是依靠互锁函数实现的)。互锁函数的缺点是只能处理相对简单的数据类型(不要和我前面说的“简单数据类型”等价起来),但另一方面,对加锁需求最高的也往往是这些类型的数据。

实际开发中,还有一种锁比较常用,这就是单写多读锁,《windows 核心编程》上有一个单写多读锁的实现,我的 blog 上有另一个实现。前者适用于需加锁的对象数量较少(例如如只有一个),访问冲突概率相对较高的情况。后者适用于需加锁的对象很多,访问冲突概率很低的情况(对象多了, 单个对象的访问冲突自然就少了)。两个实现的共同缺点是不支持重入,即同一个线程中,解锁前不能再次加锁。临界区在这方面有优势,它支持重入。使用 TLS(线程局部存储)技术进行改进应该能让它们支持重入,不过这样做了以后我那个实现应该就算不上轻量级了:)。

最后,还有其它的一些不用锁的方法也可以保证多线程中的数据一致性,其中最常用的就是循环。例如下面的例子:

struct bar
{
    volatile unsigned version;    // 一个额外的版本号字段
    int field1;
    char field2;
    char field3;
    ......
};
bar g_bar = { 0 };
// 写线程
++g_bar.version;    // 加1, version是奇数, 表示正在更新
g_bar.field1 = 10;
......
++g_bar.version;    // 再加1, version是偶数, 表示更新完毕

// 读线程
void ReadGlobalBar( bar* p )
{
    unsigned ver;
    do {
        ver = g_bar.version;
        if( ver % 2 != 0 )    // 正在更新
        {
            Sleep( 0 );    // 等待
            continue;
        }
        p->field1 = g_bar.field1;
        ......
    } while( ver != g_bar.version );
}

然而这种方法真的没用锁吗?看你怎么理解了,那个 version 字段其实就可以看做是锁的。不过它只是半个锁,因为它只锁了读操作,而没锁写操作,也就是说写操作可以随时进行而无需等待。如果读操作非常多,但写操作较少,并且你不希望写操作经常被打断,那它正好满足你的要求。它的缺点是你要保证系统中某个时刻最多有一个“writer”,“writer”一多,它就的无能为力了(这时一般应该用单写多读锁)。

2007.10.18:补充一点,关于 acquire release semantics

在多处理器平台上,一个处理器的实际的操作顺序,和其它处理器所看到的它的操作顺序可能并不相同,例如:

a++;
b++;

在其他处理器看来,很有可能 b++ 发生在前面,而 a++ 发生在后面。某些情况下,其他处理器看到的顺序必须和实际的顺序保持一致,所以就需要引入 acquire semanticsrelease semantics 了。

说一个操作具有 acquire semantics,就表示可以保证其它处理器在看到这一操作的结果前,不会看到(该处理器上)后续操作的结果,对该处理器而言,可以理解为它进行此操作前,不会进行后续操作;而一个操作具有 release semantics,就表示可以保证其它处理器在看到这一操作的结果前,能看到(该处理器)上先前所有操作的结果,对该处理器而言,可以理解为在完成所有先前的操作之前,不会进行此操作。

vc 编译器(其它编译器不一定保证)保证对 volatile 对象的写操作具有 release semantics;对 volatile 对象的读操作具有 acquire semantics。基于此点保证,多线程环境中就可以用 volatile 型对象实现锁操作了。

对 windows 互锁函数的补充

一个轻量级的单写多读锁

  • B3log

    B3log 是一个开源组织,名字来源于“Bulletin Board Blog”缩写,目标是将独立博客与论坛结合,形成一种新的网络社区体验,详细请看 B3log 构思。目前 B3log 已经开源了多款产品:SymSoloVditor思源笔记

    1063 引用 • 3454 回帖 • 189 关注
  • 线程
    122 引用 • 111 回帖 • 3 关注
  • 12 引用 • 8 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • Ruby

    Ruby 是一种开源的面向对象程序设计的服务器端脚本语言,在 20 世纪 90 年代中期由日本的松本行弘(まつもとゆきひろ/Yukihiro Matsumoto)设计并开发。在 Ruby 社区,松本也被称为马茨(Matz)。

    7 引用 • 31 回帖 • 216 关注
  • 以太坊

    以太坊(Ethereum)并不是一个机构,而是一款能够在区块链上实现智能合约、开源的底层系统。以太坊是一个平台和一种编程语言 Solidity,使开发人员能够建立和发布下一代去中心化应用。 以太坊可以用来编程、分散、担保和交易任何事物:投票、域名、金融交易所、众筹、公司管理、合同和知识产权等等。

    34 引用 • 367 回帖 • 1 关注
  • 爬虫

    网络爬虫(Spider、Crawler),是一种按照一定的规则,自动地抓取万维网信息的程序。

    106 引用 • 275 回帖 • 1 关注
  • SOHO

    为成为自由职业者在家办公而努力吧!

    7 引用 • 55 回帖 • 5 关注
  • CodeMirror
    1 引用 • 2 回帖 • 129 关注
  • Swagger

    Swagger 是一款非常流行的 API 开发工具,它遵循 OpenAPI Specification(这是一种通用的、和编程语言无关的 API 描述规范)。Swagger 贯穿整个 API 生命周期,如 API 的设计、编写文档、测试和部署。

    26 引用 • 35 回帖 • 5 关注
  • WiFiDog

    WiFiDog 是一套开源的无线热点认证管理工具,主要功能包括:位置相关的内容递送;用户认证和授权;集中式网络监控。

    1 引用 • 7 回帖 • 591 关注
  • 旅游

    希望你我能在旅途中找到人生的下一站。

    93 引用 • 899 回帖 • 3 关注
  • FlowUs

    FlowUs.息流 个人及团队的新一代生产力工具。

    让复杂的信息管理更轻松、自由、充满创意。

    1 引用
  • Mac

    Mac 是苹果公司自 1984 年起以“Macintosh”开始开发的个人消费型计算机,如:iMac、Mac mini、Macbook Air、Macbook Pro、Macbook、Mac Pro 等计算机。

    166 引用 • 595 回帖
  • 博客

    记录并分享人生的经历。

    273 引用 • 2388 回帖 • 1 关注
  • Angular

    AngularAngularJS 的新版本。

    26 引用 • 66 回帖 • 536 关注
  • QQ

    1999 年 2 月腾讯正式推出“腾讯 QQ”,在线用户由 1999 年的 2 人(马化腾和张志东)到现在已经发展到上亿用户了,在线人数超过一亿,是目前使用最广泛的聊天软件之一。

    45 引用 • 557 回帖 • 44 关注
  • Markdown

    Markdown 是一种轻量级标记语言,用户可使用纯文本编辑器来排版文档,最终通过 Markdown 引擎将文档转换为所需格式(比如 HTML、PDF 等)。

    167 引用 • 1520 回帖 • 1 关注
  • 黑曜石

    黑曜石是一款强大的知识库工具,支持本地 Markdown 文件编辑,支持双向链接和关系图。

    A second brain, for you, forever.

    16 引用 • 130 回帖
  • Bug

    Bug 本意是指臭虫、缺陷、损坏、犯贫、窃听器、小虫等。现在人们把在程序中一些缺陷或问题统称为 bug(漏洞)。

    76 引用 • 1737 回帖
  • 数据库

    据说 99% 的性能瓶颈都在数据库。

    343 引用 • 723 回帖
  • 又拍云

    又拍云是国内领先的 CDN 服务提供商,国家工信部认证通过的“可信云”,乌云众测平台认证的“安全云”,为移动时代的创业者提供新一代的 CDN 加速服务。

    21 引用 • 37 回帖 • 548 关注
  • LeetCode

    LeetCode(力扣)是一个全球极客挚爱的高质量技术成长平台,想要学习和提升专业能力从这里开始,充足技术干货等你来啃,轻松拿下 Dream Offer!

    209 引用 • 72 回帖
  • JWT

    JWT(JSON Web Token)是一种用于双方之间传递信息的简洁的、安全的表述性声明规范。JWT 作为一个开放的标准(RFC 7519),定义了一种简洁的,自包含的方法用于通信双方之间以 JSON 的形式安全的传递信息。

    20 引用 • 15 回帖 • 6 关注
  • 阿里巴巴

    阿里巴巴网络技术有限公司(简称:阿里巴巴集团)是以曾担任英语教师的马云为首的 18 人,于 1999 年在中国杭州创立,他们相信互联网能够创造公平的竞争环境,让小企业通过创新与科技扩展业务,并在参与国内或全球市场竞争时处于更有利的位置。

    43 引用 • 221 回帖 • 106 关注
  • Spring

    Spring 是一个开源框架,是于 2003 年兴起的一个轻量级的 Java 开发框架,由 Rod Johnson 在其著作《Expert One-On-One J2EE Development and Design》中阐述的部分理念和原型衍生而来。它是为了解决企业应用开发的复杂性而创建的。框架的主要优势之一就是其分层架构,分层架构允许使用者选择使用哪一个组件,同时为 JavaEE 应用程序开发提供集成的框架。

    943 引用 • 1460 回帖 • 3 关注
  • 微信

    腾讯公司 2011 年 1 月 21 日推出的一款手机通讯软件。用户可以通过摇一摇、搜索号码、扫描二维码等添加好友和关注公众平台,同时可以将自己看到的精彩内容分享到微信朋友圈。

    132 引用 • 795 回帖
  • 星云链

    星云链是一个开源公链,业内简单的将其称为区块链上的谷歌。其实它不仅仅是区块链搜索引擎,一个公链的所有功能,它基本都有,比如你可以用它来开发部署你的去中心化的 APP,你可以在上面编写智能合约,发送交易等等。3 分钟快速接入星云链 (NAS) 测试网

    3 引用 • 16 回帖 • 5 关注
  • App

    App(应用程序,Application 的缩写)一般指手机软件。

    91 引用 • 384 回帖 • 2 关注
  • Node.js

    Node.js 是一个基于 Chrome JavaScript 运行时建立的平台, 用于方便地搭建响应速度快、易于扩展的网络应用。Node.js 使用事件驱动, 非阻塞 I/O 模型而得以轻量和高效。

    139 引用 • 269 回帖 • 28 关注
  • Postman

    Postman 是一款简单好用的 HTTP API 调试工具。

    4 引用 • 3 回帖 • 7 关注