Java中字符串split() 的使用方法.没你想的那么简单

先看下面的方法,事先预测一下,经过split方法,按逗号进行分割为数组之后,生成的数组的长度是多少,目测很多人都觉得是8,但是结果却出乎意料。是5而不是8。

1,结果比期望值小

    private static void testSplit() {
        String ss = ",aa,bb,cc,dd,,,";
        String[] array = ss.split(",");

        System.out.println(array.length);//结果是5,而不是预想中的8
        for (int i = 0; i < array.length; i++) {
            System.out.println(array[i]);
        }
    }

然后就是正儿八经的运行结果图:

可以看到,结果真的是5而不是我们猜的8,这是为什么呢?

原因解析:

点进去看源码,debug一下,如下图:

可以看到,刚刚开始的时候,确实是有0-7,8个分割出来的东西存在,有三个是空字符串,""。不是null。不用担心空指针异常。

然后 看到下面的继续走,if语句,就看到,他把这个list从尾部开始判断,如果这个list的后面的字符串的长度是0,那么这个resultSize就 减减,然后一直while循环,

直到不符合条件,那么list的下标是5、6、7的值就被抛弃了,然后新生的结果字符串数组,的大小就变成加工过后的长度,那么就变成了长度 5的数组。

list.subList(0, resultSize).toArray(result)

就是这句话啦。

他只是处理后面尾部的空字符串,不处理中间的空字符串和 开头的空字符串。

知道这个原理之后,那么这个 问题以后怎么变,你都了然于胸啦。


2,支持正则表达式

(2017/07/13更新)

现在要求字符串

"aa12sas32sasa223sas12as12wqe"//去掉数字,然后弄成数组
"aa,,sas,,sasa,,,,sasas,,,"//去掉逗号,不管几个逗号,都去掉
"aa  sas sa sa     sas  as  "//去掉空格,也不管几个,
把他们给分解成数组,同时刨除掉不用的多余信息。

具体实现代码如下:

    private static void testSplitPlus() {
        String ss = "aa12sas32sasa223sas12as12wqe";
        String[] array = ss.split("[\\d]+");
        System.out.println(Arrays.toString(array));
        ss = "aa,,sas,,sasa,,,,sasas,,,";
        array = ss.split("[,]+");
        System.out.println(Arrays.toString(array));
        ss = "aa  sas sa sa     sas  as  ";
        array = ss.split("[\\s]+");
        System.out.println(Arrays.toString(array));
    }

下面再看看这个split的源码。

    public String[] split(String regex) {
        return split(regex, 0);
    }

不知道你看到没,那个regex,不就是正则表达式的意思嘛?

那就明白了,这个方法是支持正则表达式操作的。那上面的代码就好解释啦。

第一个[\\d]+这个解释就是\\是转义符,d表示数字,括起来后面的加号表示一个或者多个,那么就可以解释运行结果啦。

第二个[,]解释类似,就是逗号出现一次或多次,

第三个,\\s,就是匹配任何空白字符,包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。

然后下面,看运行结果。

这就是我们要的结果啦。


3,split(string,limit)

虽说,直接使用 split(string),会自动抛弃后面的空数据,这如果不是我期望的,

我非的要后面的空数据,即使是不存在的,我也想要,怎么办呢?

使用 split(string,limit)就是这个函数。

主要是这个limit的值,就是你期望的返回数组的长度的值。即使后面的值是空的,也会给你返回到那个结果数组中的。

要是这个预期值稍微给的小一点,会是什么结果呢?

    /**
     * 期望个数
     * 1,不带期望值,最后一个是空,会被直接丢掉
     * 2,带期望值,期望是7,实际值是7,最后是空,还保留
     * 3,带期望值,期望是6,实际值是7,最后的2个就不split了
     * 4,带期望值,期望是5,实际值是7,最后的3个就不split了
     */
    @Test
    public void expected() {
        String ss = "1|2|3||7|4|";
        String[] split = ss.split("\\|", 7);
        // [1, 2, 3, , 7, 4, ]
        System.out.println(Arrays.toString(split));

        split = ss.split("\\|");
        // [1, 2, 3, , 7, 4]
        System.out.println(Arrays.toString(split));

         split = ss.split("\\|", 6);
        // [1, 2, 3, , 7, 4|]
        System.out.println(Arrays.toString(split));

        split = ss.split("\\|", 5);
        // [1, 2, 3, , 7|4|]
        System.out.println(Arrays.toString(split));
    }

结果竟然是这么滴,又超出了想象。。。这个带期望值的也有用不好的时候。就比如上面最后一个,后面的一大片会拥堵在一起,这个估计也不是我们期望的效果。也算是意料之外的麻烦。

简单问题,并不简单哟

  • 53
    点赞
  • 115
    收藏
    觉得还不错? 一键收藏
  • 24
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 24
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值