概述
Copy-on-Write 模式,与其说是一种技术,还不如说是一种思想即写时复制,它在诸多方面都有应用。比如当我们使用 fork()
方法在 linux 中创建子进程时,并不复制整个进程的地址空间,而是让子进程和父进程共享同一个内存空间;只有父进程或者子进程需要写入时,才复制地址空间,让父进程和子进程拥有独立的内存空间。这就是一种典型的 Copy-on-Wirte 模式,也是一种延迟写思想的体现。
这种思想在 Java 的容器的实现上也有着广泛的应用。
在 Java 中的应用
CopyOnWriteArrayList
和 CopyOnWriteArraySet
这两个 Copy-on-Write 容器,它们背后的设计思想就是 Copy-on-Write;通过 Copy-on-Write 这两个容器实现的读操作是无锁的,由于无锁,所以将读操作的性能发挥到了极致。
我们以 CopyOnWriteArrayList 为例,讲讲其内部是如何实现的。
首先我们可以看其 set()
和 get()
方法的实现:
public E get(int index) {
//直接返回对应位置的值
return elementAt(getArray(), index);
}
public E set(int index, E element) {
//加同步锁保证线程安全
synchronized (lock) {
Object[] es = getArray();
E oldValue = elementAt(es, index);
//设置的值不和原来的值相等,则进行复制操作
if (oldValue != element) {
es = es.clone();
es[index] = element;
}
// Ensure volatile write semantics even when oldvalue == element
setArray(es);
return oldValue;
}
}
get()
方法内部比较简单就是直接返回对应位置值,核心实际上是在 set()
,首先在执行 set()
方法设置新值时,先和原来的旧值进行判断,如果不同则进行 copy 新的空间。
整个过程用图表示如下:
CopyOnWriteArrayList
内部维护一个 Array 数组当进行**“读操作”直接迭代即可,当发生写操作的时候,会复制一块新的数据空间,复制完成之后再将数组指针指向新的数组空间。如果在这个过程中发生读操作,则读取的仍然原来的旧数组(快照)**。
通过这种方式可以大大提高**“读的效率”**。
但如果要使用 CopyOnWriteArrayList
有两个注意点:
- 要注意应用场景:CopyOnWriteArrayList 仅适用于写操作非常少的场景,而且能够容忍读写的短暂不一致。
- CopyOnWriteArrayList 迭代器是只读的,不支持增删改。因为迭代器遍历的仅仅是一个快照,而对快照进行增删改是没有意义的。
CopyOnWriteArraySet
内部是借助与 CopyOnWriteArrayList
实现的,只是在 add 的时候调用的是 CopyOnWriteArrayList
的 addIfAbsent()
来实现去重,此处不再详述。
总结
Copy-On-Write
本质上讲是一种延迟复制的思想,在执行读操作的时候,不进行复制,而只有真正执行写操作的时候才进行复制。它的应用也非常广泛,比如 linux 中的 fork()
方法,java 中的 CopyOnWriteArrayList
。在使用时要注意其应用场景,因为其每次发生写操作都会复制新的空间,因此它天然适合读多,写少的场景,并且能够忍受一定时间的读写不一致。
欢迎来到这里!
我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。
注册 关于