谜之 Loop 性能优化

背景

大家都知道，在写循环语句时有个优化技巧就是将条件计算尽量放到循环外部，避免每次循环时触发不必要的调用和计算，比如将


for (int i = 0; i < s.length(); i++) {
    // ....
}

优化为：


int len = s.length();
for (int i = 0; i < len; i++) {
    // ....
}

问题

有了以上的优化技巧， 你对下面代码的执行结果预期是 innerLen 更快还是 outerLen 更快呢？


package test;

import java.util.HashSet;
import java.util.Set;

public class Loop {

    public static void main(String[] args) throws Exception {
        String str = "dummy";

        for (int i = 0; i < 25; i++) {
            str += str;
        }

        System.out.println("len: " + str.length());

        System.out.print("inner: ");
        final long startInner = System.currentTimeMillis();
        innerLen(str);
        System.out.println(System.currentTimeMillis() - startInner);

        System.out.print("outer: ");
        final long startOuter = System.currentTimeMillis();
        outerLen(str);
        System.out.println(System.currentTimeMillis() - startOuter);
    }

    public static void outerLen(final String s) {
        final Set<String> set = new HashSet<>();

        final int len = s.length();
        for (int i = 0; i < len; i++) {
            set.add("i");
        }
    }

    public static void innerLen(final String s) {
        final Set<String> set = new HashSet<>();

        for (int i = 0; i < s.length(); i++) {
            set.add("i");
        }
    }
}

如果你也得到和我类似的结果（inner 更快）：


len: 167772160
inner: 352
outer: 480

握个爪先，我们来分析分析。

反汇编

因为 JVM 的强大，很多时候我们都会觉得：“是不是编译器偷偷做了什么优化导致结果反常？”带着这个疑问，我们就先看下字节码文件反汇编出来的结果：


C:\Users\s\Documents\NetBeansProjects\Test\build\classes>javap -c test\Loop.class
Compiled from "Loop.java"
public class test.Loop {
  public test.Loop();
    Code:
       0: aload_0
       1: invokespecial #1                  // Method java/lang/Object."<init>":()V
       4: return

  public static void main(java.lang.String[]) throws java.lang.Exception;
    Code:
       略过

  public static void outerLen(java.lang.String);
    Code:
       0: new           #19                 // class java/util/HashSet
       3: dup
       4: invokespecial #20                 // Method java/util/HashSet."<init>":()V
       7: astore_1
       8: aload_0
       9: invokevirtual #9                  // Method java/lang/String.length:()I
      12: istore_2                          // len 结果保存在变量 2 中
      13: iconst_0                          // 将整型值 0 入栈
      14: istore_3                          // 出栈并存入变量 3 中
      15: iload_3                           // 载入变量 3（循环开始，i = 0）
      16: iload_2                           // 载入变量 2，即 len
      17: if_icmpge     35                  // 变量 3 大于等于变量 2 的话跳到 35（结束循环） 
      20: aload_1                            
      21: ldc           #21                 // String i
      23: invokeinterface #22,  2           // InterfaceMethod java/util/Set.add:(Ljava/lang/Object;)Z
      28: pop
      29: iinc          3, 1                // 变量 3 自加 1
      32: goto          15
      35: return

  public static void innerLen(java.lang.String);
    Code:
       0: new           #19                 // class java/util/HashSet
       3: dup
       4: invokespecial #20                 // Method java/util/HashSet."<init>":()V
       7: astore_1
       8: iconst_0
       9: istore_2
      10: iload_2
      11: aload_0
      12: invokevirtual #9                  // Method java/lang/String.length:()I
      15: if_icmpge     33
      18: aload_1
      19: ldc           #21                 // String i
      21: invokeinterface #22,  2           // InterfaceMethod java/util/Set.add:(Ljava/lang/Object;)Z
      26: pop
      27: iinc          2, 1
      30: goto          10
      33: return
}

outerLen 的 15-32 是循环部分，innerLen 的 10-30 是循环部分。我们可以清晰看到 innerLen 在循环中调用了 String#length() 方法，所以理论上它的耗时是会更多的。

那为什么还会出现 innerLen 耗时更短的现象呢？

更多的测试

编译器永远是对的，代码也没看出来问题，那就是测试方式不对了？

加入多种测试方式并记录结果：

重复 10 次运行，发现全部都是 innerLen 快
通过调换 outerLen 和 innerLen 执行顺序（让 outerLen 先跑），我们发现结果逆转了，outerLen 终于符合预期，更快了

同一次运行中加入重复次数


for (int i = 0; i < 10; i++) {
    System.out.print("inner: ");
    long startInner = System.currentTimeMillis();
    innerLen(str);
    System.out.println(System.currentTimeMillis() - startInner);

    System.out.print("outer: ");
    long startOuter = System.currentTimeMillis();
    outerLen(str);
    System.out.println(System.currentTimeMillis() - startOuter);

    System.out.println("----");
}

发现除了第一次是 innerLen 快，其余 9 次均是 outerLen 快，这 9 次符合预期

看来问题是因为 JVM 某种“动态”因素决定的，这个因素很可能和 GC 有关。

Java 对象的绝地求生

[图片] 一个 Java 对象的一生非常悲情，在需要时产生，在无用时消亡。当一个 Java 对象被可达性分析算法指明 GC Roots 到这个对象不可达时就宣告了这个对象即将面临被消亡的处境。那么死亡是注定的吗？幸运的是它有一次“自救”的机会。当对象进行可达性分析后发现没有与 GC Roots 相连的引用链，那么它将 ..

走进 JVM 之 GC

[图片] GC 知识点主要分三个部分：如何判断该对象要回收（是垃圾）回收的算法有哪些？垃圾收集器判断一个对象是否可以回收 1. 引用计数法 Python 采用该种算法，但是解决了相互引用的问题为对象添加一个引用计数器，当对象增加一个引用时计数器加 1，引用失效时计数器减 1。引用计数为 0 的对象可被回收。 ..

Java 垃圾收集器与内存分配策略

垃圾收集器与内存分配策略 Java 内存运行时区域的各个部分，其中程序计数器、虚拟机栈、本地方法栈 3 个区域随线程而生，随线程而灭，栈中的栈帧随着方法的进入和退出而有条不紊地执行着出栈和入栈操作。每一个栈帧中分配多少内存基本上是在类结构确定下来就已知的，因此这几个区域的内存分配和回收都具备确定性，在这几个区域内就不 ..

JVM 垃圾回收 (CMS 和 G1) 篇

GC Roots 对象的包括如下几种：虚拟机栈 (栈桢中的本地变量表) 中的引用的对象；方法区中的类静态属性引用的对象；方法区中的常量引用的对象；本地方法栈中 JNI 的引用的对象； CMS 垃圾回收器 [图片] 新生代：eden space + 2 个 survivor ; 老年代：old space ..

HotSpot 探究——GC 的运行过程以及机制

[图片] 写在前面：先说说为什么要开始学这些东西，因为自己还只是一个本科生，最近在看各大公司面试题以及招聘要求的时候深深的感受到了自己的不足，所以趁自己还有属于自己的闲余时间，努力的充实自己吧！JVM 的底层原理是基本每个公司在招聘 JAVA 程序员的时候都会出的面试题，虽然有 “面试造火箭,入职拧螺丝!” 这种吐槽 ..

一次线上 java 应用响应时间过长问题的排查

[图片] 最近接手一个老 java 应用，没多久接到响应时间太长的报警，整个排查过程还是挺有意思的，记录一下。整个过程中，设计到 cpu，内存，垃圾回收，引用，spring, 单例等等知识，整个下来，心情愉悦。接到报警吃完晚饭回来，接到报警短信，服务响应时间太长，达到 2s 以上。第一反应，怎么可能，这个应用 ..

初步认识 Garbage First（G1）垃圾回收器

[图片] 本文将会介绍 Garbage First（简称 G1）垃圾回收器的基本使用，以及在 HotSpot 中如何应用 G1。通过本文，你将会学习到 G1 的内部工作原理、它的关键参数，以及如何读懂它产生的日志信息。鉴于本文目标读者是有一定的 Java 开发经验的程序员，因此本文不再累赘 Java 语言、Java ..

欢迎来到这里！

我们正在构建一个小众社区，大家在这里相互信任，以平等 • 自由 • 奔放的价值观进行分享交流。最终，希望大家能够找到与自己志同道合的伙伴，共同成长。

关于

40 回帖