Go 并发原理

本贴最后更新于 2211 天前,其中的信息可能已经东海扬尘

Go 语言是为并发而生的语言,Go 语言是为数不多的在语言层面实现并发的语言;也正是 Go 语言的并发特性,吸引了全球无数的开发者。

并发(concurrency)和并行(parallellism)

并发(concurrency):两个或两个以上的任务在一段时间内被执行。我们不必 care 这些任务在某一个时间点是否是同时执行,可能同时执行,也可能不是,我们只关心在一段时间内,哪怕是很短的时间(一秒或者两秒)是否执行解决了两个或两个以上任务。

并行(parallellism):两个或两个以上的任务在同一时刻被同时执行。

并发说的是逻辑上的概念,而并行,强调的是物理运行状态。并发“包含”并行。

(详情请见:Rob Pike 的PPT

Go 的 CSP 并发模型

Go 实现了两种并发形式。第一种是大家普遍认知的:多线程共享内存。其实就是 Java 或者 C++ 等语言中的多线程开发。另外一种是 Go 语言特有的,也是 Go 语言推荐的:CSP(communicating sequential processes)并发模型。

CSP 并发模型是在 1970 年左右提出的概念,属于比较新的概念,不同于传统的多线程通过共享内存来通信,CSP 讲究的是“以通信的方式来共享内存”。

请记住下面这句话:
Do not communicate by sharing memory; instead, share memory by communicating.
“不要以共享内存的方式来通信,相反,要通过通信来共享内存。”

普通的线程并发模型,就是像 Java、C++、或者 Python,他们线程间通信都是通过共享内存的方式来进行的。非常典型的方式就是,在访问共享数据(例如数组、Map、或者某个结构体或对象)的时候,通过锁来访问,因此,在很多时候,衍生出一种方便操作的数据结构,叫做“线程安全的数据结构”。例如 Java 提供的包”java.util.concurrent”中的数据结构。Go 中也实现了传统的线程并发模型。

Go 的 CSP 并发模型,是通过 goroutinechannel 来实现的。

  • goroutine 是 Go 语言中并发的执行单位。有点抽象,其实就是和传统概念上的”线程“类似,可以理解为”线程“。
  • channel 是 Go 语言中各个并发结构体(goroutine)之前的通信机制。 通俗的讲,就是各个 goroutine 之间通信的”管道“,有点类似于 Linux 中的管道。

生成一个 goroutine 的方式非常的简单:Go 一下,就生成了。

go f();

通信机制 channel 也很方便,传数据用 channel <- data,取数据用 <-channel

在通信过程中,传数据 channel <- data 和取数据 <-channel 必然会成对出现,因为这边传,那边取,两个 goroutine 之间才会实现通信。

而且不管传还是取,必阻塞,直到另外的 goroutine 传或者取为止。

有两个 goroutine,其中一个发起了向 channel 中发起了传值操作。(goroutine 为矩形,channel 为箭头)

sendpng

左边的 goroutine 开始阻塞,等待有人接收。

这时候,右边的 goroutine 发起了接收操作。

acceptpng

右边的 goroutine 也开始阻塞,等待别人传送。

这时候,两边 goroutine 都发现了对方,于是两个 goroutine 开始一传,一收。

communicatepng

这便是 Golang CSP 并发模型最基本的形式。

Go 并发模型的实现原理

我们先从线程讲起,无论语言层面何种并发模型,到了操作系统层面,一定是以线程的形态存在的。而操作系统根据资源访问权限的不同,体系架构可分为用户空间和内核空间;内核空间主要操作访问 CPU 资源、I/O 资源、内存资源等硬件资源,为上层应用程序提供最基本的基础资源,用户空间呢就是上层应用程序的固定活动空间,用户空间不可以直接访问资源,必须通过“系统调用”、“库函数”或“Shell 脚本”来调用内核空间提供的资源。

我们现在的计算机语言,可以狭义的认为是一种“软件”,它们中所谓的“线程”,往往是用户态的线程,和操作系统本身内核态的线程(简称 KSE),还是有区别的。

线程模型的实现,可以分为以下几种方式:

用户级线程模型

yonghutaipng

如图所示,多个用户态的线程对应着一个内核线程,程序线程的创建、终止、切换或者同步等线程工作必须自身来完成。

内核级线程模型

neiheji1png

这种模型直接调用操作系统的内核线程,所有线程的创建、终止、切换、同步等操作,都由内核来完成。C++ 就是这种。

两级线程模型

liangjipng

这种模型是介于用户级线程模型和内核级线程模型之间的一种线程模型。这种模型的实现非常复杂,和内核级线程模型类似,一个进程中可以对应多个内核级线程,但是进程中的线程不和内核线程一一对应;这种线程模型会先创建多个内核级线程,然后用自身的用户级线程去对应创建的多个内核级线程,自身的用户级线程需要本身程序去调度,内核级的线程交给操作系统内核去调度。

Go 语言的线程模型就是一种特殊的两级线程模型。暂且叫它“MPG”模型吧。

Go 线程实现模型 MPG

M 指的是 Machine,一个 M 直接关联了一个内核线程。

P 指的是 processor,代表了 M 所需的上下文环境,也是处理用户级代码逻辑的处理器。

G 指的是 Goroutine,其实本质上也是一种轻量级的线程。

三者关系如下图所示:

GMPrelationpng

以上这个图讲的是两个线程(内核线程)的情况。一个 M 会对应一个内核线程,一个 M 也会连接一个上下文 P,一个上下文 P 相当于一个“处理器”,一个上下文连接一个或者多个 GoroutineP(Processor) 的数量是在启动时被设置为环境变量 GOMAXPROCS 的值,或者通过运行时调用函数 runtime.GOMAXPROCS() 进行设置。Processor 数量固定意味着任意时刻只有固定数量的线程在运行 go 代码。Goroutine 中就是我们要执行并发的代码。图中 P 正在执行的 Goroutine 为蓝色的;处于待执行状态的 Goroutine 为灰色的,灰色的 Goroutine 形成了一个队列 runqueues

三者关系的宏观的图为:

totalpng

抛弃 P(Processor)

你可能会想,为什么一定需要一个上下文,我们能不能直接除去上下文,让 Goroutinerunqueues 挂到 M 上呢?答案是不行,需要上下文的目的,是让我们可以直接放开其他线程,当遇到内核线程阻塞的时候。

一个很简单的例子就是系统调用 sysall,一个线程肯定不能同时执行代码和系统调用被阻塞,这个时候,此线程 M 需要放弃当前的上下文环境 P,以便可以让其他的 Goroutine 被调度执行。

giveupPpng

如上图左图所示,M0 中的 G0 执行了 syscall,然后就创建了一个 M1(也有可能本身就存在,没创建),(转向右图)然后 M0 丢弃了 P,等待 syscall 的返回值,M1 接受了 P,将·继续执行 Goroutine 队列中的其他 Goroutine

当系统调用 syscall 结束后,M0 会“偷”一个上下文,如果不成功,M0 就把它的 Gouroutine G0 放到一个全局的 runqueue 中,然后自己放到线程池或者转入休眠状态。全局 runqueue 是各个 P 在运行完自己的本地的 Goroutine runqueue 后用来拉取新 goroutine 的地方。P 也会周期性的检查这个全局 runqueue 上的 goroutine,否则,全局 runqueue 上的 goroutines 可能得不到执行而饿死。

均衡的分配工作

按照以上的说法,上下文 P 会定期的检查全局的 goroutine 队列中的 goroutine,以便自己在消费掉自身 Goroutine 队列的时候有事可做。假如全局 goroutine 队列中的 goroutine 也没了呢?就从其他运行的中的 Prunqueue 里偷。

每个 P 中的 Goroutine 不同导致他们运行的效率和时间也不同,在一个有很多 PM 的环境中,不能让一个 P 跑完自身的 Goroutine 就没事可做了,因为或许其他的 P 有很长的 goroutine 队列要跑,得需要均衡。
该如何解决呢?

Go 的做法倒也直接,从其他 P 中偷一半!

参考文献

RyuGou 的博客

The Go scheduler

  • golang

    Go 语言是 Google 推出的一种全新的编程语言,可以在不损失应用程序性能的情况下降低代码的复杂性。谷歌首席软件工程师罗布派克(Rob Pike)说:我们之所以开发 Go,是因为过去 10 多年间软件开发的难度令人沮丧。Go 是谷歌 2009 发布的第二款编程语言。

    497 引用 • 1387 回帖 • 283 关注

相关帖子

1 回帖

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • Go 的调度器目前还是协作式的,如果负载比较重,或出现卡顿的现象.
    一个性能开销比较的点,是需要在每个函数调用点检查是否需要进行协程调度。
    这样的开销是比较大的。
    Go1.12 会试验一个抢占式的调度器,希望能改善。