社区进程 CPU 占用高导致的卡顿问题排查了一整天。jstack 分析栈、代码 review、Netty TCP 连接排查、其他相关进程排查、NGINX、数据库等都看了一遍。我把会的技能基本都用上了,还是定位不到问题,节点一启动后 CPU 就居高不下。回滚代码到前天晚上也没用,找不到问题。
jstack
最后重启操作系统了,reboot 后 10 多分钟都连不上 SSH,阿里云管理控制台上 VNC 也连不上。后来点了实例重启,又等了 10 多分钟才启动好,有惊无险。等社区进程启动好后观察了一阵子,CPU 占用正常,看上去已经通过“重启大法”解决问题了。
reboot
没能定位到这个诡异的问题有点遗憾,不过也许指不定什么时候又来一波呢?
社区进程 CPU 占用高导致的卡顿问题排查了一整天。
jstack
分析栈、代码 review、Netty TCP 连接排查、其他相关进程排查、NGINX、数据库等都看了一遍。我把会的技能基本都用上了,还是定位不到问题,节点一启动后 CPU 就居高不下。回滚代码到前天晚上也没用,找不到问题。最后重启操作系统了,
reboot
后 10 多分钟都连不上 SSH,阿里云管理控制台上 VNC 也连不上。后来点了实例重启,又等了 10 多分钟才启动好,有惊无险。等社区进程启动好后观察了一阵子,CPU 占用正常,看上去已经通过“重启大法”解决问题了。没能定位到这个诡异的问题有点遗憾,不过也许指不定什么时候又来一波呢?