【GO 语言】合理配置 GOMAXPROCS 提升一倍以上的性能

GOMAXPROCS 用默认的，就是 CPU 的硬件线程数目，

对于大部分 File IO 密集的应用是不合适的。

至少应该配置到硬件线程数目的 5 倍以上, 最大 1024。

具体参见。

这是为什么呢？

我们来复习下 Go 的线程模型，M/P/G 三种对象，分别代表操作系统线程、协程执行令牌、协程；

在任何情况下，Go 运行时并行执行（注意，不是并发）的 goroutines 数量是小于等于 P 的数量的。

如果一个持有 P 的 M，由于 P 当前执行的 G 调用了 syscall 而导致 M 被阻塞，那么：

注意

关键点：此时，GO 的调度器是迟钝的，它很可能什么都没做，直到 M 阻塞了想当长时间以后，才会发现有一个 P/M 被 syscall 阻塞了。然后，才会用空闲的 M 来强这个 P。

补充说明：调度器迟钝不是 M 迟钝，M 也就是操作系统线程，是非常的敏感的，只要阻塞就会被操作系统调度（除了极少数自旋的情况）。但是 GO 的调度器会等待一个时间间隔才会行动，这也是为了减少调度器干预的次数。也就是说，如果一个 M 调用了什么 API 导致了操作系统线程阻塞了，操作系统立刻会把这个线程 M 调度走，挂起等阻塞解除。这时候，Go 调度器不会马上把这个 M 持有的 P 抢走。这就会导致一定的 P 被浪费了。

这就是为何，GOMAXPROCS 太小，也就是 P 的数量太少，会导致 IO 密集(或者 syscall 较多)的 go 程序运行缓慢的原因。

那么，GOMAXPROCS 很大，超过硬件线程的 8 倍，会不会有开销呢？

答案是，开销是有的，但是远小于 Go 运行时迟钝的调度 M 来抢夺 P 而导致 CPU 利用不足的开销。

P.S.

本文至少对 Go 1.8 版本是有效的。

P.S.

其实，这也是经典的长肥管道问题，由于 SSD 的普及，IO 操作从高延时低吞吐，变成了中高延时高吞吐。

一次 SSD IO 的延时在 1ms，而一块企业级 SSD 的吞吐在 100Kops，那么在队列里面的操作就有 100 个。

操作系统在 1ms 内可以完成很多次线程调度（一般情况 1ms 可以完成几十次线程调度），但是 Go 的运行时，最大的阻塞发现延时是 10ms。

于是，当一个 Go 的协程发起一次 SSD IO 时，执行该 G 的 M 会阻塞然后被 OS 调度走，该 M 一直持有 P。在 1ms 内，这次 SSD IO 很可能不会完成。Go 的运行时，最快在 20us，最慢在 10ms 会发现有一个 M 持有 P 并阻塞了。运气不好的话，很可能，Go 运行时 2ms 才扫描一次，于是没来得及发现这个阻塞的 M，阻塞就结束了。宝贵的 P 资源就这么被阻塞的 M 浪费了。SSD IO 的 ops 上限变成了

*P 的数量 （1s/IO 延时）

当 P 的数量小于 100，IO 延时 1ms 的时候，ops 就肯定小于 100Kops 了。

MySQL 性能优化（十五）

[图片] 性能优化 MySQL 性能优化包括查询速度优化、数据库结构优化、MySQL 服务器优化等。优化简介 MySQL 数据库优化是多方面的，优化表结构、索引、查询语句等使查询响应更快。在 MySQL 中，可以使用 SHOW STATUS 语句查询一些 MySQL 数据库的性能参数。语句语法如下： SHOW ST ..

常用的 Java 性能测试工具实战

nmon：获取系统性能数据除了在上一篇博客中介绍的 top、free 等命令，还有一些将资源整合在一起的监控工具，nmon 便是一个老牌的 Linux 性能监控工具，它不仅有漂亮的监控界面，还能通过配套的 nmonchar 产出细致的监控报表。 [图片] 我在对应用做性能评估时，通常会加上 nmon 的报告，这会让测 ..

I/O 与零拷贝

【整理】【原文：[http://www.52im.net/thread-3280-1-1.html 】 1、什么是 I/O？ I/O 就是简单的数据 copy。 Q1：既然是 copy 数据，那么从哪里 copy 到哪里？数据从外部设备 copy 到内存就是 Input，数据从内存 copy 到外部设备就是 Out ..

线程与线程池

1、CPU CPU 并不知道线程进程之类的概念 CPU 只知道两件事：从内存中取出指令执行指令，然后回到 1 [图片] Q1：CPU 从哪里取出指令？ PC 寄存器（Program Counter），也就是程序计数器，可以把寄存器理解为存取速度更快的内存。 Q2：PC 寄存器中存放的是什么？存放的是指 ..

进程，系统性能和计划任务 3

3 任务计划通过任务计划，可以让系统自动的按时间或周期性任务执行任务注意: 学习本节需要实现邮件通知,学习内容前必须安装并启动邮件服务范例：环境准备 [root@centos8 ~]#yum -y install postfix [root@centos8 ~]#systemctl enable --now po ..

进程，系统性能和计划任务 2

[图片] 2 进程管理和性能工具参考链接：http://www.brendangregg.com/linuxperf.html [图片] 2.1 进程树 pstree pstree 可以用来显示进程的父子关系，以树形结构显示格式： pstree [OPTION] [ PID | USER ] 常用选项： -p 显示 ..

欢迎来到这里！

我们正在构建一个小众社区，大家在这里相互信任，以平等 • 自由 • 奔放的价值观进行分享交流。最终，希望大家能够找到与自己志同道合的伙伴，共同成长。

关于

6 回帖

注册关于

请输入回帖内容 ...

someone • 7 年前

GOMAXPROCS 对于 GO 来说非常重要, 很多服务在高压力下,响应延时变大就是因为 GOMAXPROCS 设置的太小导致的.
对于 8 个 Cores 的服务器,GOMAXPROCS 设置到 60 是比较合适的一般情况.

1 回复
salamander • 6 年前

60 你是怎么得出来的

1 回复
linker • 6 年前 via macOS
订阅者付费者赞助者作者

经验数字.
linker • 6 年前
订阅者付费者赞助者作者

期待 Go 1.12 的新调度器，应该是一个抢占式的调度器。
可以极大的减少 Go 的延时。

1 回复
salamander • 6 年前

我倒是在看 go 2.0 的泛型

1 回复
linker • 6 年前
订阅者付费者赞助者作者

估计要很久以后了。

【GO 语言】合理配置 GOMAXPROCS 提升一倍以上的性能

相关帖子

MySQL 性能优化（十五）

大家用什么工具或平台来做接口性能测试

常用的 Java 性能测试工具实战

I/O 与零拷贝

线程与线程池

进程，系统性能和计划任务 3

进程，系统性能和计划任务 2

欢迎来到这里！

近期热议

推荐标签标签

最新标签

【GO 语言】合理配置 GOMAXPROCS 提升一倍以上的性能

相关帖子

MySQL 性能优化（十五）

大家用什么工具或平台来做接口性能测试

常用的 Java 性能测试工具实战

I/O 与零拷贝

线程与线程池

进程，系统性能和计划任务 3

进程，系统性能和计划任务 2

欢迎来到这里！

近期热议

推荐标签 标签

最新标签

推荐标签标签