关于 tomcat 线程池调优的问题

本贴最后更新于 1978 天前,其中的信息可能已经时过境迁

一个小直播平台,随着用户增加,性能出现了问题,开始是消息延迟,接的是腾讯的 im,做过测试,10000 条消息可能会有 20 条会有 100 多秒的延迟才有响应,我们所有的消息是放在 spring 的异步线程池做处理,当时 spring 线程池的数量设置的最大数量是 200,队列是 1 万,策略是队列不足主线程跑,但是消息延迟更明显了,看日志发现 spring 的线程池一直开的很高,随后就把最大数量改到了 2000 队列改到 2000(这么做是不想让消息在队列里停留太久)就这样好过一阵子,然后每次感觉很卡的时候就不停的加负载(主服务 23 台负载在 4 台服务器上),对了忘记说了。架构就是 zk 加 dubbo,其实 dubbo 也没拆分很大,主要对后台管理系统提供服务。所以全部压力都在这 23 台负载上,我们运维给 tomcat 线程池设置到了 1000,后来改到了 2000,但是我发现接口响应变的更久了,切了份 nginx 日志,在高峰期,平均接口响应都在 20 秒之上,我的天那,(我一度怀疑是代码或者 db 的问题,我们的 redis mysql 都是买的阿里的)平时都是 0.00 几响应, 然后我看了负载 tomcat 的日志,惊奇的发现,高峰期 随便一个线程执行 距下次执行都是 20 秒以上,看了很多资料,觉得是线程设置太高,线程切换时间用的久。但是我们的 cpu 高峰也就只跑了 40% 而且日志里线程最高就只跑到 1400,大佬们,有谁能给我指跳路,
目前我觉得是线程设置太高了,导致引起的一系列问题。。
太难的做不了,然后人手也不够,就两个后台 java,一个运维还什么也不懂。。为难我这个没做过并发的一年小开发了。。。。

  • Tomcat

    Tomcat 最早是由 Sun Microsystems 开发的一个 Servlet 容器,在 1999 年被捐献给 ASF(Apache Software Foundation),隶属于 Jakarta 项目,现在已经独立为一个顶级项目。Tomcat 主要实现了 JavaEE 中的 Servlet、JSP 规范,同时也提供 HTTP 服务,是市场上非常流行的 Java Web 容器。

    162 引用 • 529 回帖 • 1 关注
  • 并发
    75 引用 • 73 回帖 • 1 关注
  • Q&A

    提问之前请先看《提问的智慧》,好的问题比好的答案更有价值。

    8449 引用 • 38491 回帖 • 155 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • jackfruitran
    作者

    我们服务器单台是 8 核 16G 的,我觉得他们设置线程都是 2 倍核心数什么的,没有过这方面经验,也不知道具体设置多少是少,求经验大佬给点经验,今天尝试了把一台负载 tomcat 最大线程数改到 500 试一试 明天看下日志的效果,但是我还怕 cpu 切换线程是对系统的,一台机子 5 6 台负载 只改了一台又不会有效果

  • 88250

    CPU 一直是爆表的么?如果不是的话考虑下是不是 IO 造成的延迟,比如对外的网络连接。

    1 回复
  • jackfruitran
    作者

    cpu 最开始只有 10% 现在高峰期就 40% 对外的网络连接有,但是大部分都在异步连接池里,有延迟的比例也很少。。大 d 之前有用 tomcat 吗,线程池参数是怎么设置的。。。

    1 回复
  • 88250

    最好是查一下官方文档再调。我总感觉你这不是线程池的问题。 加点耗时日志看看,另外可以用 jstack、jmap 等工具看看 JVM 状态。

    2 回复
  • jackfruitran
    作者

    😭 现在的能力啃不动官方文档。。。只能到处找帖子看别人经验,,,现在是所有的接口在高峰期 响应都很慢,,我看日志,通过日志的线程号,一条条追的,同一个线程号,第二次在执行就是 30 秒 40 之后了,正常最多一秒就该跑第二条了,如果是代码里有问题的,不应该每一个线程都要这么久啊,,肯定会有很快执行完的啊。。而且低峰的时候我们代码正常响应速度在 0.00 几秒(nginx 看的)这些也都是我看日志猜的。。我真的是没什么经验,,很忧伤

  • jackfruitran
    作者

    耗时日志的话 就是 nginx 响应时间看到了,接口高峰请求 10S-30S 不等,低峰 0.00 几秒就完事了,,jvm 堆内存快照的话 不敢在生产环境直接用 ,每个知识点 都要先看很久资料 再开始用,真的是太菜了,而且身边也没大佬带,

    1 回复
  • 88250

    加诊断日志比较稳妥高效,先排除第三方调用影响,这个最不可控。把有可能耗时的点都列出来,逐一排除。

请输入回帖内容 ...

推荐标签 标签

  • 微软

    微软是一家美国跨国科技公司,也是世界 PC 软件开发的先导,由比尔·盖茨与保罗·艾伦创办于 1975 年,公司总部设立在华盛顿州的雷德蒙德(Redmond,邻近西雅图)。以研发、制造、授权和提供广泛的电脑软件服务业务为主。

    8 引用 • 44 回帖
  • LaTeX

    LaTeX(音译“拉泰赫”)是一种基于 ΤΕΧ 的排版系统,由美国计算机学家莱斯利·兰伯特(Leslie Lamport)在 20 世纪 80 年代初期开发,利用这种格式,即使使用者没有排版和程序设计的知识也可以充分发挥由 TeX 所提供的强大功能,能在几天,甚至几小时内生成很多具有书籍质量的印刷品。对于生成复杂表格和数学公式,这一点表现得尤为突出。因此它非常适用于生成高印刷质量的科技和数学类文档。

    12 引用 • 54 回帖 • 49 关注
  • OkHttp

    OkHttp 是一款 HTTP & HTTP/2 客户端库,专为 Android 和 Java 应用打造。

    16 引用 • 6 回帖 • 75 关注
  • SEO

    发布对别人有帮助的原创内容是最好的 SEO 方式。

    35 引用 • 200 回帖 • 27 关注
  • 阿里云

    阿里云是阿里巴巴集团旗下公司,是全球领先的云计算及人工智能科技公司。提供云服务器、云数据库、云安全等云计算服务,以及大数据、人工智能服务、精准定制基于场景的行业解决方案。

    89 引用 • 345 回帖 • 1 关注
  • 周末

    星期六到星期天晚,实行五天工作制后,指每周的最后两天。再过几年可能就是三天了。

    14 引用 • 297 回帖
  • InfluxDB

    InfluxDB 是一个开源的没有外部依赖的时间序列数据库。适用于记录度量,事件及实时分析。

    2 引用 • 76 关注
  • C++

    C++ 是在 C 语言的基础上开发的一种通用编程语言,应用广泛。C++ 支持多种编程范式,面向对象编程、泛型编程和过程化编程。

    107 引用 • 153 回帖
  • Python

    Python 是一种面向对象、直译式电脑编程语言,具有近二十年的发展历史,成熟且稳定。它包含了一组完善而且容易理解的标准库,能够轻松完成很多常见的任务。它的语法简捷和清晰,尽量使用无异义的英语单词,与其它大多数程序设计语言使用大括号不一样,它使用缩进来定义语句块。

    545 引用 • 672 回帖
  • CAP

    CAP 指的是在一个分布式系统中, Consistency(一致性)、 Availability(可用性)、Partition tolerance(分区容错性),三者不可兼得。

    11 引用 • 5 回帖 • 612 关注
  • 反馈

    Communication channel for makers and users.

    123 引用 • 913 回帖 • 250 关注
  • 支付宝

    支付宝是全球领先的独立第三方支付平台,致力于为广大用户提供安全快速的电子支付/网上支付/安全支付/手机支付体验,及转账收款/水电煤缴费/信用卡还款/AA 收款等生活服务应用。

    29 引用 • 347 回帖 • 5 关注
  • 人工智能

    人工智能(Artificial Intelligence)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。

    135 引用 • 190 回帖
  • Ngui

    Ngui 是一个 GUI 的排版显示引擎和跨平台的 GUI 应用程序开发框架,基于
    Node.js / OpenGL。目标是在此基础上开发 GUI 应用程序可拥有开发 WEB 应用般简单与速度同时兼顾 Native 应用程序的性能与体验。

    7 引用 • 9 回帖 • 394 关注
  • FFmpeg

    FFmpeg 是一套可以用来记录、转换数字音频、视频,并能将其转化为流的开源计算机程序。

    23 引用 • 32 回帖 • 1 关注
  • V2Ray
    1 引用 • 15 回帖 • 1 关注
  • 小说

    小说是以刻画人物形象为中心,通过完整的故事情节和环境描写来反映社会生活的文学体裁。

    28 引用 • 108 回帖
  • H2

    H2 是一个开源的嵌入式数据库引擎,采用 Java 语言编写,不受平台的限制,同时 H2 提供了一个十分方便的 web 控制台用于操作和管理数据库内容。H2 还提供兼容模式,可以兼容一些主流的数据库,因此采用 H2 作为开发期的数据库非常方便。

    11 引用 • 54 回帖 • 653 关注
  • sts
    2 引用 • 2 回帖 • 197 关注
  • jsoup

    jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据。

    6 引用 • 1 回帖 • 483 关注
  • CloudFoundry

    Cloud Foundry 是 VMware 推出的业界第一个开源 PaaS 云平台,它支持多种框架、语言、运行时环境、云平台及应用服务,使开发人员能够在几秒钟内进行应用程序的部署和扩展,无需担心任何基础架构的问题。

    5 引用 • 18 回帖 • 172 关注
  • GAE

    Google App Engine(GAE)是 Google 管理的数据中心中用于 WEB 应用程序的开发和托管的平台。2008 年 4 月 发布第一个测试版本。目前支持 Python、Java 和 Go 开发部署。全球已有数十万的开发者在其上开发了众多的应用。

    14 引用 • 42 回帖 • 779 关注
  • IDEA

    IDEA 全称 IntelliJ IDEA,是一款 Java 语言开发的集成环境,在业界被公认为最好的 Java 开发工具之一。IDEA 是 JetBrains 公司的产品,这家公司总部位于捷克共和国的首都布拉格,开发人员以严谨著称的东欧程序员为主。

    181 引用 • 400 回帖
  • 互联网

    互联网(Internet),又称网际网络,或音译因特网、英特网。互联网始于 1969 年美国的阿帕网,是网络与网络之间所串连成的庞大网络,这些网络以一组通用的协议相连,形成逻辑上的单一巨大国际网络。

    98 引用 • 344 回帖
  • abitmean

    有点意思就行了

    27 关注
  • 智能合约

    智能合约(Smart contract)是一种旨在以信息化方式传播、验证或执行合同的计算机协议。智能合约允许在没有第三方的情况下进行可信交易,这些交易可追踪且不可逆转。智能合约概念于 1994 年由 Nick Szabo 首次提出。

    1 引用 • 11 回帖 • 2 关注
  • Hadoop

    Hadoop 是由 Apache 基金会所开发的一个分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。

    86 引用 • 122 回帖 • 626 关注