锁?不锁?如何锁?

本贴最后更新于 2417 天前,其中的信息可能已经天翻地覆

加锁、解锁(同步/互斥)是多线程中非常基本的操作,但我却看到不少的代码对它们处理的很不好。简单说来有三类问题,一是加锁范围太大,虽然避免了逻辑错误,但锁了不该锁的东西,难免降低程序的效率;二是该锁的不锁,导致各种莫名其妙的错误;三是加锁方式不合适,该用临界区的用内核对象等,也会降低程序的效率。

要正确的运用锁操作,首先要弄清楚什么时候需要加锁。很多书上都说在可能“同时发生多个写操作”或“同时发生读写操作”时,应该加锁。这固然没什么错,但我认为它没有说到问题的根上,更准确的表述应该是:如果不加锁会导致不可容忍的数据不一致,那么就应该加锁。据此,我在下表中列出了多线程中应该加锁和无需加锁的条件,其中的“简单数据类型”是指 cpu 可以在一条指令中完成操作的数据类型,一般整形和所有比整形小的数据类型都是,除此之外的类型都属于“复杂数据类型”,例如你自己定义的结构体等。

操作的结果与初值无关 操作的结果与初值相关
写简单数据类型 不需要加锁 ① 需要加锁 ②
写复杂数据类型 需要加锁 ③ 需要加锁 ④
读简单数据类型 不需要加锁 ⑤ 不需要加锁 ⑥
读复杂数据类型 需要加锁 ⑦ 需要加锁 ⑧

大家可能注意到,在第 1、5、6 种情况下,我认为可以不加锁,粗看起来,这与书上的说法有些矛盾。其实却不然,因为这些操作可以在一条指令内完成,所以它们具有天然的“原子性”,我们可以认为 cpu 已经给它们加锁了,我们没必要再画蛇添足。如果这个理由还不够的话,你不妨想一下我们再加一次锁是否有用,看下面的代码(以第 1 种情况为例):

Lock(); // ①
n = 10; // ②
Unlock(); // ③
int x = n; // ④

看出来了吗?不管语句 ①③ 是否存在,这段代码执行完毕后,我们都无法保证 x 的值是 10。也许你会想如果把 ③④ 两条语句的位置换一下,x 就肯定是 10 了。可是在这个例子中,想让 x 是 10,为什么不把语句 ④ 直接换成 int x = 10; 呢?既省了加锁,又减少了键盘的磨损,何乐而不为?!而且,我的这个例子并不是刻意构造的,在多线程,这种情况比比皆是。

第 2 种情况的典型代表是 i++;,需要对它加锁是因为它表面上虽然只有一条语句,却要执行至少两个操作,一是读出 i 的初始,二是把加一后的结果写回去,两个操作就没有“原子性”了,所以需要加锁。

另外,上表中判断是否需要加锁的依据是“是否可能造成数据不一致”。实际上,有些情况下数据不一致是可以容忍的,如果它发生概率极低、造成的不良后果可以忽略、并能很快自动恢复,那它可能就是可以容忍的。对这种数据不一致,我们可以不加锁。不过对它的判定与程序的实际情况关联太大,我们在这里就不讨论了。

加锁的方法也可分为三类,临界区、内核对象和互锁函数。相比前两类,互锁函数的知名度要低不少,但它却是我用的最多的方法,因为它有一个最大的优点:快!有不少书上比较临界区和内核对象时都说临界区的优点是不会进入内核模式,速度快。不过这是不全面的,如果没有冲突(实际发生冲突的概率一般很低),临界区确实不会进内核模式,但如果发生了冲突要进行等待,它就要依靠内核对象了。而互锁函数则绝不会进内核模式,所以互锁函数是最快的(临界区在没有冲突时的行为是依靠互锁函数实现的)。互锁函数的缺点是只能处理相对简单的数据类型(不要和我前面说的“简单数据类型”等价起来),但另一方面,对加锁需求最高的也往往是这些类型的数据。

实际开发中,还有一种锁比较常用,这就是单写多读锁,《windows 核心编程》上有一个单写多读锁的实现,我的 blog 上有另一个实现。前者适用于需加锁的对象数量较少(例如如只有一个),访问冲突概率相对较高的情况。后者适用于需加锁的对象很多,访问冲突概率很低的情况(对象多了, 单个对象的访问冲突自然就少了)。两个实现的共同缺点是不支持重入,即同一个线程中,解锁前不能再次加锁。临界区在这方面有优势,它支持重入。使用 TLS(线程局部存储)技术进行改进应该能让它们支持重入,不过这样做了以后我那个实现应该就算不上轻量级了:)。

最后,还有其它的一些不用锁的方法也可以保证多线程中的数据一致性,其中最常用的就是循环。例如下面的例子:

struct bar
{
    volatile unsigned version;    // 一个额外的版本号字段
    int field1;
    char field2;
    char field3;
    ......
};
bar g_bar = { 0 };
// 写线程
++g_bar.version;    // 加1, version是奇数, 表示正在更新
g_bar.field1 = 10;
......
++g_bar.version;    // 再加1, version是偶数, 表示更新完毕

// 读线程
void ReadGlobalBar( bar* p )
{
    unsigned ver;
    do {
        ver = g_bar.version;
        if( ver % 2 != 0 )    // 正在更新
        {
            Sleep( 0 );    // 等待
            continue;
        }
        p->field1 = g_bar.field1;
        ......
    } while( ver != g_bar.version );
}

然而这种方法真的没用锁吗?看你怎么理解了,那个 version 字段其实就可以看做是锁的。不过它只是半个锁,因为它只锁了读操作,而没锁写操作,也就是说写操作可以随时进行而无需等待。如果读操作非常多,但写操作较少,并且你不希望写操作经常被打断,那它正好满足你的要求。它的缺点是你要保证系统中某个时刻最多有一个“writer”,“writer”一多,它就的无能为力了(这时一般应该用单写多读锁)。

2007.10.18:补充一点,关于 acquire release semantics

在多处理器平台上,一个处理器的实际的操作顺序,和其它处理器所看到的它的操作顺序可能并不相同,例如:

a++;
b++;

在其他处理器看来,很有可能 b++ 发生在前面,而 a++ 发生在后面。某些情况下,其他处理器看到的顺序必须和实际的顺序保持一致,所以就需要引入 acquire semanticsrelease semantics 了。

说一个操作具有 acquire semantics,就表示可以保证其它处理器在看到这一操作的结果前,不会看到(该处理器上)后续操作的结果,对该处理器而言,可以理解为它进行此操作前,不会进行后续操作;而一个操作具有 release semantics,就表示可以保证其它处理器在看到这一操作的结果前,能看到(该处理器)上先前所有操作的结果,对该处理器而言,可以理解为在完成所有先前的操作之前,不会进行此操作。

vc 编译器(其它编译器不一定保证)保证对 volatile 对象的写操作具有 release semantics;对 volatile 对象的读操作具有 acquire semantics。基于此点保证,多线程环境中就可以用 volatile 型对象实现锁操作了。

对 windows 互锁函数的补充

一个轻量级的单写多读锁

  • B3log

    B3log 是一个开源组织,名字来源于“Bulletin Board Blog”缩写,目标是将独立博客与论坛结合,形成一种新的网络社区体验,详细请看 B3log 构思。目前 B3log 已经开源了多款产品:SymSoloVditor思源笔记

    1063 引用 • 3453 回帖 • 201 关注
  • 线程
    122 引用 • 111 回帖 • 3 关注
  • 12 引用 • 8 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • GitBook

    GitBook 使您的团队可以轻松编写和维护高质量的文档。 分享知识,提高团队的工作效率,让用户满意。

    3 引用 • 8 回帖 • 4 关注
  • MyBatis

    MyBatis 本是 Apache 软件基金会 的一个开源项目 iBatis,2010 年这个项目由 Apache 软件基金会迁移到了 google code,并且改名为 MyBatis ,2013 年 11 月再次迁移到了 GitHub。

    170 引用 • 414 回帖 • 383 关注
  • Git

    Git 是 Linux Torvalds 为了帮助管理 Linux 内核开发而开发的一个开放源码的版本控制软件。

    209 引用 • 358 回帖
  • 国际化

    i18n(其来源是英文单词 internationalization 的首末字符 i 和 n,18 为中间的字符数)是“国际化”的简称。对程序来说,国际化是指在不修改代码的情况下,能根据不同语言及地区显示相应的界面。

    8 引用 • 26 回帖
  • Jenkins

    Jenkins 是一套开源的持续集成工具。它提供了非常丰富的插件,让构建、部署、自动化集成项目变得简单易用。

    53 引用 • 37 回帖
  • 数据库

    据说 99% 的性能瓶颈都在数据库。

    338 引用 • 705 回帖
  • RYMCU

    RYMCU 致力于打造一个即严谨又活泼、专业又不失有趣,为数百万人服务的开源嵌入式知识学习交流平台。

    4 引用 • 6 回帖 • 53 关注
  • Latke

    Latke 是一款以 JSON 为主的 Java Web 框架。

    70 引用 • 533 回帖 • 778 关注
  • Ant-Design

    Ant Design 是服务于企业级产品的设计体系,基于确定和自然的设计价值观上的模块化解决方案,让设计者和开发者专注于更好的用户体验。

    17 引用 • 23 回帖
  • 程序员

    程序员是从事程序开发、程序维护的专业人员。

    565 引用 • 3532 回帖
  • 开源中国

    开源中国是目前中国最大的开源技术社区。传播开源的理念,推广开源项目,为 IT 开发者提供了一个发现、使用、并交流开源技术的平台。目前开源中国社区已收录超过两万款开源软件。

    7 引用 • 86 回帖
  • 小薇

    小薇是一个用 Java 写的 QQ 聊天机器人 Web 服务,可以用于社群互动。

    由于 Smart QQ 从 2019 年 1 月 1 日起停止服务,所以该项目也已经停止维护了!

    34 引用 • 467 回帖 • 741 关注
  • 禅道

    禅道是一款国产的开源项目管理软件,她的核心管理思想基于敏捷方法 scrum,内置了产品管理和项目管理,同时又根据国内研发现状补充了测试管理、计划管理、发布管理、文档管理、事务管理等功能,在一个软件中就可以将软件研发中的需求、任务、bug、用例、计划、发布等要素有序的跟踪管理起来,完整地覆盖了项目管理的核心流程。

    6 引用 • 15 回帖 • 127 关注
  • Mobi.css

    Mobi.css is a lightweight, flexible CSS framework that focus on mobile.

    1 引用 • 6 回帖 • 733 关注
  • WebComponents

    Web Components 是 W3C 定义的标准,它给了前端开发者扩展浏览器标签的能力,可以方便地定制可复用组件,更好的进行模块化开发,解放了前端开发者的生产力。

    1 引用 • 2 关注
  • Bootstrap

    Bootstrap 是 Twitter 推出的一个用于前端开发的开源工具包。它由 Twitter 的设计师 Mark Otto 和 Jacob Thornton 合作开发,是一个 CSS / HTML 框架。

    18 引用 • 33 回帖 • 659 关注
  • Firefox

    Mozilla Firefox 中文俗称“火狐”(正式缩写为 Fx 或 fx,非正式缩写为 FF),是一个开源的网页浏览器,使用 Gecko 排版引擎,支持多种操作系统,如 Windows、OSX 及 Linux 等。

    8 引用 • 30 回帖 • 407 关注
  • 996
    13 引用 • 200 回帖 • 2 关注
  • Gitea

    Gitea 是一个开源社区驱动的轻量级代码托管解决方案,后端采用 Go 编写,采用 MIT 许可证。

    4 引用 • 16 回帖
  • Scala

    Scala 是一门多范式的编程语言,集成面向对象编程和函数式编程的各种特性。

    13 引用 • 11 回帖 • 123 关注
  • ZooKeeper

    ZooKeeper 是一个分布式的,开放源码的分布式应用程序协调服务,是 Google 的 Chubby 一个开源的实现,是 Hadoop 和 HBase 的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。

    59 引用 • 29 回帖 • 3 关注
  • 正则表达式

    正则表达式(Regular Expression)使用单个字符串来描述、匹配一系列遵循某个句法规则的字符串。

    31 引用 • 94 回帖 • 1 关注
  • OpenShift

    红帽提供的 PaaS 云,支持多种编程语言,为开发人员提供了更为灵活的框架、存储选择。

    14 引用 • 20 回帖 • 623 关注
  • 阿里巴巴

    阿里巴巴网络技术有限公司(简称:阿里巴巴集团)是以曾担任英语教师的马云为首的 18 人,于 1999 年在中国杭州创立,他们相信互联网能够创造公平的竞争环境,让小企业通过创新与科技扩展业务,并在参与国内或全球市场竞争时处于更有利的位置。

    43 引用 • 221 回帖 • 127 关注
  • 一些有用的避坑指南。

    69 引用 • 93 回帖
  • Ubuntu

    Ubuntu(友帮拓、优般图、乌班图)是一个以桌面应用为主的 Linux 操作系统,其名称来自非洲南部祖鲁语或豪萨语的“ubuntu”一词,意思是“人性”、“我的存在是因为大家的存在”,是非洲传统的一种价值观,类似华人社会的“仁爱”思想。Ubuntu 的目标在于为一般用户提供一个最新的、同时又相当稳定的主要由自由软件构建而成的操作系统。

    124 引用 • 169 回帖
  • MongoDB

    MongoDB(来自于英文单词“Humongous”,中文含义为“庞大”)是一个基于分布式文件存储的数据库,由 C++ 语言编写。旨在为应用提供可扩展的高性能数据存储解决方案。MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。它支持的数据结构非常松散,是类似 JSON 的 BSON 格式,因此可以存储比较复杂的数据类型。

    90 引用 • 59 回帖 • 4 关注