锁?不锁?如何锁?

本贴最后更新于 2604 天前,其中的信息可能已经天翻地覆

加锁、解锁(同步/互斥)是多线程中非常基本的操作,但我却看到不少的代码对它们处理的很不好。简单说来有三类问题,一是加锁范围太大,虽然避免了逻辑错误,但锁了不该锁的东西,难免降低程序的效率;二是该锁的不锁,导致各种莫名其妙的错误;三是加锁方式不合适,该用临界区的用内核对象等,也会降低程序的效率。

要正确的运用锁操作,首先要弄清楚什么时候需要加锁。很多书上都说在可能“同时发生多个写操作”或“同时发生读写操作”时,应该加锁。这固然没什么错,但我认为它没有说到问题的根上,更准确的表述应该是:如果不加锁会导致不可容忍的数据不一致,那么就应该加锁。据此,我在下表中列出了多线程中应该加锁和无需加锁的条件,其中的“简单数据类型”是指 cpu 可以在一条指令中完成操作的数据类型,一般整形和所有比整形小的数据类型都是,除此之外的类型都属于“复杂数据类型”,例如你自己定义的结构体等。

操作的结果与初值无关 操作的结果与初值相关
写简单数据类型 不需要加锁 ① 需要加锁 ②
写复杂数据类型 需要加锁 ③ 需要加锁 ④
读简单数据类型 不需要加锁 ⑤ 不需要加锁 ⑥
读复杂数据类型 需要加锁 ⑦ 需要加锁 ⑧

大家可能注意到,在第 1、5、6 种情况下,我认为可以不加锁,粗看起来,这与书上的说法有些矛盾。其实却不然,因为这些操作可以在一条指令内完成,所以它们具有天然的“原子性”,我们可以认为 cpu 已经给它们加锁了,我们没必要再画蛇添足。如果这个理由还不够的话,你不妨想一下我们再加一次锁是否有用,看下面的代码(以第 1 种情况为例):

Lock(); // ① n = 10; // ② Unlock(); // ③ int x = n; // ④

看出来了吗?不管语句 ①③ 是否存在,这段代码执行完毕后,我们都无法保证 x 的值是 10。也许你会想如果把 ③④ 两条语句的位置换一下,x 就肯定是 10 了。可是在这个例子中,想让 x 是 10,为什么不把语句 ④ 直接换成 int x = 10; 呢?既省了加锁,又减少了键盘的磨损,何乐而不为?!而且,我的这个例子并不是刻意构造的,在多线程,这种情况比比皆是。

第 2 种情况的典型代表是 i++;,需要对它加锁是因为它表面上虽然只有一条语句,却要执行至少两个操作,一是读出 i 的初始,二是把加一后的结果写回去,两个操作就没有“原子性”了,所以需要加锁。

另外,上表中判断是否需要加锁的依据是“是否可能造成数据不一致”。实际上,有些情况下数据不一致是可以容忍的,如果它发生概率极低、造成的不良后果可以忽略、并能很快自动恢复,那它可能就是可以容忍的。对这种数据不一致,我们可以不加锁。不过对它的判定与程序的实际情况关联太大,我们在这里就不讨论了。

加锁的方法也可分为三类,临界区、内核对象和互锁函数。相比前两类,互锁函数的知名度要低不少,但它却是我用的最多的方法,因为它有一个最大的优点:快!有不少书上比较临界区和内核对象时都说临界区的优点是不会进入内核模式,速度快。不过这是不全面的,如果没有冲突(实际发生冲突的概率一般很低),临界区确实不会进内核模式,但如果发生了冲突要进行等待,它就要依靠内核对象了。而互锁函数则绝不会进内核模式,所以互锁函数是最快的(临界区在没有冲突时的行为是依靠互锁函数实现的)。互锁函数的缺点是只能处理相对简单的数据类型(不要和我前面说的“简单数据类型”等价起来),但另一方面,对加锁需求最高的也往往是这些类型的数据。

实际开发中,还有一种锁比较常用,这就是单写多读锁,《windows 核心编程》上有一个单写多读锁的实现,我的 blog 上有另一个实现。前者适用于需加锁的对象数量较少(例如如只有一个),访问冲突概率相对较高的情况。后者适用于需加锁的对象很多,访问冲突概率很低的情况(对象多了, 单个对象的访问冲突自然就少了)。两个实现的共同缺点是不支持重入,即同一个线程中,解锁前不能再次加锁。临界区在这方面有优势,它支持重入。使用 TLS(线程局部存储)技术进行改进应该能让它们支持重入,不过这样做了以后我那个实现应该就算不上轻量级了:)。

最后,还有其它的一些不用锁的方法也可以保证多线程中的数据一致性,其中最常用的就是循环。例如下面的例子:

struct bar { volatile unsigned version; // 一个额外的版本号字段 int field1; char field2; char field3; ...... }; bar g_bar = { 0 }; // 写线程 ++g_bar.version; // 加1, version是奇数, 表示正在更新 g_bar.field1 = 10; ...... ++g_bar.version; // 再加1, version是偶数, 表示更新完毕 // 读线程 void ReadGlobalBar( bar* p ) { unsigned ver; do { ver = g_bar.version; if( ver % 2 != 0 ) // 正在更新 { Sleep( 0 ); // 等待 continue; } p->field1 = g_bar.field1; ...... } while( ver != g_bar.version ); }

然而这种方法真的没用锁吗?看你怎么理解了,那个 version 字段其实就可以看做是锁的。不过它只是半个锁,因为它只锁了读操作,而没锁写操作,也就是说写操作可以随时进行而无需等待。如果读操作非常多,但写操作较少,并且你不希望写操作经常被打断,那它正好满足你的要求。它的缺点是你要保证系统中某个时刻最多有一个“writer”,“writer”一多,它就的无能为力了(这时一般应该用单写多读锁)。

2007.10.18:补充一点,关于 acquire release semantics

在多处理器平台上,一个处理器的实际的操作顺序,和其它处理器所看到的它的操作顺序可能并不相同,例如:

a++; b++;

在其他处理器看来,很有可能 b++ 发生在前面,而 a++ 发生在后面。某些情况下,其他处理器看到的顺序必须和实际的顺序保持一致,所以就需要引入 acquire semanticsrelease semantics 了。

说一个操作具有 acquire semantics,就表示可以保证其它处理器在看到这一操作的结果前,不会看到(该处理器上)后续操作的结果,对该处理器而言,可以理解为它进行此操作前,不会进行后续操作;而一个操作具有 release semantics,就表示可以保证其它处理器在看到这一操作的结果前,能看到(该处理器)上先前所有操作的结果,对该处理器而言,可以理解为在完成所有先前的操作之前,不会进行此操作。

vc 编译器(其它编译器不一定保证)保证对 volatile 对象的写操作具有 release semantics;对 volatile 对象的读操作具有 acquire semantics。基于此点保证,多线程环境中就可以用 volatile 型对象实现锁操作了。

对 windows 互锁函数的补充

一个轻量级的单写多读锁

  • B3log

    B3log 是一个开源组织,名字来源于“Bulletin Board Blog”缩写,目标是将独立博客与论坛结合,形成一种新的网络社区体验,详细请看 B3log 构思。目前 B3log 已经开源了多款产品:SymSoloVditor思源笔记

    1063 引用 • 3455 回帖 • 160 关注
  • 线程
    123 引用 • 111 回帖 • 3 关注
  • 12 引用 • 8 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • Jenkins

    Jenkins 是一套开源的持续集成工具。它提供了非常丰富的插件,让构建、部署、自动化集成项目变得简单易用。

    54 引用 • 37 回帖 • 1 关注
  • Access
    1 引用 • 3 回帖 • 2 关注
  • 锤子科技

    锤子科技(Smartisan)成立于 2012 年 5 月,是一家制造移动互联网终端设备的公司,公司的使命是用完美主义的工匠精神,打造用户体验一流的数码消费类产品(智能手机为主),改善人们的生活质量。

    4 引用 • 31 回帖 • 3 关注
  • 微服务

    微服务架构是一种架构模式,它提倡将单一应用划分成一组小的服务。服务之间互相协调,互相配合,为用户提供最终价值。每个服务运行在独立的进程中。服务于服务之间才用轻量级的通信机制互相沟通。每个服务都围绕着具体业务构建,能够被独立的部署。

    96 引用 • 155 回帖 • 4 关注
  • Dubbo

    Dubbo 是一个分布式服务框架,致力于提供高性能和透明化的 RPC 远程服务调用方案,是 [阿里巴巴] SOA 服务化治理方案的核心框架,每天为 2,000+ 个服务提供 3,000,000,000+ 次访问量支持,并被广泛应用于阿里巴巴集团的各成员站点。

    60 引用 • 82 回帖 • 614 关注
  • 996
    13 引用 • 200 回帖 • 6 关注
  • TextBundle

    TextBundle 文件格式旨在应用程序之间交换 Markdown 或 Fountain 之类的纯文本文件时,提供更无缝的用户体验。

    1 引用 • 2 回帖 • 81 关注
  • 阿里巴巴

    阿里巴巴网络技术有限公司(简称:阿里巴巴集团)是以曾担任英语教师的马云为首的 18 人,于 1999 年在中国杭州创立,他们相信互联网能够创造公平的竞争环境,让小企业通过创新与科技扩展业务,并在参与国内或全球市场竞争时处于更有利的位置。

    43 引用 • 221 回帖 • 62 关注
  • V2Ray
    1 引用 • 15 回帖 • 1 关注
  • Mobi.css

    Mobi.css is a lightweight, flexible CSS framework that focus on mobile.

    1 引用 • 6 回帖 • 757 关注
  • JetBrains

    JetBrains 是一家捷克的软件开发公司,该公司位于捷克的布拉格,并在俄国的圣彼得堡及美国麻州波士顿都设有办公室,该公司最为人所熟知的产品是 Java 编程语言开发撰写时所用的集成开发环境:IntelliJ IDEA

    18 引用 • 54 回帖 • 1 关注
  • CSS

    CSS(Cascading Style Sheet)“层叠样式表”是用于控制网页样式并允许将样式信息与网页内容分离的一种标记性语言。

    199 引用 • 542 回帖
  • Bootstrap

    Bootstrap 是 Twitter 推出的一个用于前端开发的开源工具包。它由 Twitter 的设计师 Mark Otto 和 Jacob Thornton 合作开发,是一个 CSS / HTML 框架。

    18 引用 • 33 回帖 • 647 关注
  • Vue.js

    Vue.js(读音 /vju ː/,类似于 view)是一个构建数据驱动的 Web 界面库。Vue.js 的目标是通过尽可能简单的 API 实现响应的数据绑定和组合的视图组件。

    268 引用 • 666 回帖
  • Electron

    Electron 基于 Chromium 和 Node.js,让你可以使用 HTML、CSS 和 JavaScript 构建应用。它是一个由 GitHub 及众多贡献者组成的活跃社区共同维护的开源项目,兼容 Mac、Windows 和 Linux,它构建的应用可在这三个操作系统上面运行。

    15 引用 • 136 回帖 • 5 关注
  • DevOps

    DevOps(Development 和 Operations 的组合词)是一组过程、方法与系统的统称,用于促进开发(应用程序/软件工程)、技术运营和质量保障(QA)部门之间的沟通、协作与整合。

    58 引用 • 25 回帖 • 2 关注
  • Webswing

    Webswing 是一个能将任何 Swing 应用通过纯 HTML5 运行在浏览器中的 Web 服务器,详细介绍请看 将 Java Swing 应用变成 Web 应用

    1 引用 • 15 回帖 • 641 关注
  • 创造

    你创造的作品可能会帮助到很多人,如果是开源项目的话就更赞了!

    184 引用 • 1018 回帖
  • webpack

    webpack 是一个用于前端开发的模块加载器和打包工具,它能把各种资源,例如 JS、CSS(less/sass)、图片等都作为模块来使用和处理。

    42 引用 • 130 回帖 • 249 关注
  • 星云链

    星云链是一个开源公链,业内简单的将其称为区块链上的谷歌。其实它不仅仅是区块链搜索引擎,一个公链的所有功能,它基本都有,比如你可以用它来开发部署你的去中心化的 APP,你可以在上面编写智能合约,发送交易等等。3 分钟快速接入星云链 (NAS) 测试网

    3 引用 • 16 回帖
  • wolai

    我来 wolai:不仅仅是未来的云端笔记!

    2 引用 • 14 回帖 • 3 关注
  • BND

    BND(Baidu Netdisk Downloader)是一款图形界面的百度网盘不限速下载器,支持 Windows、Linux 和 Mac,详细介绍请看这里

    107 引用 • 1281 回帖 • 32 关注
  • Android

    Android 是一种以 Linux 为基础的开放源码操作系统,主要使用于便携设备。2005 年由 Google 收购注资,并拉拢多家制造商组成开放手机联盟开发改良,逐渐扩展到到平板电脑及其他领域上。

    336 引用 • 324 回帖
  • HTML

    HTML5 是 HTML 下一个的主要修订版本,现在仍处于发展阶段。广义论及 HTML5 时,实际指的是包括 HTML、CSS 和 JavaScript 在内的一套技术组合。

    108 引用 • 295 回帖
  • 开源

    Open Source, Open Mind, Open Sight, Open Future!

    412 引用 • 3588 回帖 • 1 关注
  • CodeMirror
    2 引用 • 17 回帖 • 162 关注
  • CloudFoundry

    Cloud Foundry 是 VMware 推出的业界第一个开源 PaaS 云平台,它支持多种框架、语言、运行时环境、云平台及应用服务,使开发人员能够在几秒钟内进行应用程序的部署和扩展,无需担心任何基础架构的问题。

    5 引用 • 18 回帖 • 181 关注