10 张图带你深入理解 Docker 容器和镜像

本贴最后更新于 1174 天前,其中的信息可能已经渤澥桑田

原文链接:Visualizing Docker Containers and Images(翻译:杨润青)

【编者的话】本文用图文并茂的方式介绍了容器、镜像的区别和 Docker 每个命令后面的技术细节,能够很好的帮助读者深入理解 Docker。

如果你想和我或者更多 Docker 专家交流,可以加我微信 liyingjiese,备注『加群』。群里每周都有全球各大公司的最佳 Docker 实践以及行业最新动态。

这篇文章希望能够帮助读者深入理解 Docker 的命令,还有容器(container)和镜像(image)之间的区别,并深入探讨容器和运行中的容器之间的区别。
1.png

当我对 Docker 技术还是一知半解的时候,我发现理解 Docker 的命令非常困难。于是,我花了几周的时间来学习 Docker 的工作原理,更确切地说,是关于 Docker 统一文件系统(the union file system)的知识,然后回过头来再看 Docker 的命令,一切变得顺理成章,简单极了。

题外话:就我个人而言,掌握一门技术并合理使用它的最好办法就是深入理解这项技术背后的工作原理。通常情况下,一项新技术的诞生常常会伴随着媒体的大肆宣传和炒作,这使得用户很难看清技术的本质。更确切地说,新技术总是会发明一些新的术语或者隐喻词来帮助宣传,这在初期是非常有帮助的,但是这给技术的原理蒙上了一层砂纸,不利于用户在后期掌握技术的真谛。

Git 就是一个很好的例子。我之前不能够很好的使用 Git,于是我花了一段时间去学习 Git 的原理,直到这时,我才真正明白了 Git 的用法。我坚信只有真正理解 Git 内部原理的人才能够掌握这个工具。

Image Definition

镜像(Image)就是一堆只读层(read-only layer)的统一视角,也许这个定义有些难以理解,下面的这张图能够帮助读者理解镜像的定义。
2.png

从左边我们看到了多个只读层,它们重叠在一起。除了最下面一层,其它层都会有一个指针指向下一层。这些层是 Docker 内部的实现细节,并且能够在主机(译者注:运行 Docker 的机器)的文件系统上访问到。统一文件系统(union file system)技术能够将不同的层整合成一个文件系统,为这些层提供了一个统一的视角,这样就隐藏了多层的存在,在用户的角度看来,只存在一个文件系统。我们可以在图片的右边看到这个视角的形式。

你可以在你的主机文件系统上找到有关这些层的文件。需要注意的是,在一个运行中的容器内部,这些层是不可见的。在我的主机上,我发现它们存在于/var/lib/docker/aufs 目录下。

sudo tree -L 1 /var/lib/docker/

/var/lib/docker/ ├── aufs ├── containers ├── graph ├── init ├── linkgraph.db ├── repositories-aufs ├── tmp ├── trust └── volumes 7 directories, 2 files

Container Definition

容器(container)的定义和镜像(image)几乎一模一样,也是一堆层的统一视角,唯一区别在于容器的最上面那一层是可读可写的。
3.png

细心的读者可能会发现,容器的定义并没有提及容器是否在运行,没错,这是故意的。正是这个发现帮助我理解了很多困惑。

要点:容器 = 镜像 + 读写层。并且容器的定义并没有提及是否要运行容器。

接下来,我们将会讨论运行态容器。

Running Container Definition

一个运行态容器(running container)被定义为一个可读写的统一文件系统加上隔离的进程空间和包含其中的进程。下面这张图片展示了一个运行中的容器。
4.png

正是文件系统隔离技术使得 Docker 成为了一个前途无量的技术。一个容器中的进程可能会对文件进行修改、删除、创建,这些改变都将作用于可读写层(read-write layer)。下面这张图展示了这个行为。
5.png

我们可以通过运行以下命令来验证我们上面所说的:

docker run ubuntu touch happiness.txt

即便是这个 ubuntu 容器不再运行,我们依旧能够在主机的文件系统上找到这个新文件。

find / -name happiness.txt

/var/lib/docker/aufs/diff/860a7b...889/happiness.txt

Image Layer Definition

为了将零星的数据整合起来,我们提出了镜像层(image layer)这个概念。下面的这张图描述了一个镜像层,通过图片我们能够发现一个层并不仅仅包含文件系统的改变,它还能包含了其他重要信息。
6.png

元数据(metadata)就是关于这个层的额外信息,它不仅能够让 Docker 获取运行和构建时的信息,还包括父层的层次信息。需要注意,只读层和读写层都包含元数据。
7.png

除此之外,每一层都包括了一个指向父层的指针。如果一个层没有这个指针,说明它处于最底层。
8.png

Metadata Location:
我发现在我自己的主机上,镜像层(image layer)的元数据被保存在名为”json”的文件中,比如说:

/var/lib/docker/graph/e809f156dc985.../json

e809f156dc985...就是这层的 id

一个容器的元数据好像是被分成了很多文件,但或多或少能够在/var/lib/docker/containers/目录下找到,就是一个可读层的 id。这个目录下的文件大多是运行时的数据,比如说网络,日志等等。

全局理解(Tying It All Together)

现在,让我们结合上面提到的实现细节来理解 Docker 的命令。

docker create

9.png

docker create 命令为指定的镜像(image)添加了一个可读写层,构成了一个新的容器。注意,这个容器并没有运行。
10.png

docker start

11.png

Docker start 命令为容器文件系统创建了一个进程隔离空间。注意,每一个容器只能够有一个进程隔离空间。

docker run

12.png

看到这个命令,读者通常会有一个疑问:docker start 和 docker run 命令有什么区别。
13.png

从图片可以看出,docker run 命令先是利用镜像创建了一个容器,然后运行这个容器。这个命令非常的方便,并且隐藏了两个命令的细节,但从另一方面来看,这容易让用户产生误解。

题外话:继续我们之前有关于 Git 的话题,我认为 docker run 命令类似于 git pull 命令。git pull 命令就是 git fetch 和 git merge 两个命令的组合,同样的,docker run 就是 docker create 和 docker start 两个命令的组合。

docker ps

14.png

docker ps 命令会列出所有运行中的容器。这隐藏了非运行态容器的存在,如果想要找出这些容器,我们需要使用下面这个命令。

docker ps –a

15.png

docker ps –a 命令会列出所有的容器,不管是运行的,还是停止的。

docker images

16.png

docker images 命令会列出了所有顶层(top-level)镜像。实际上,在这里我们没有办法区分一个镜像和一个只读层,所以我们提出了 top-level 镜像。只有创建容器时使用的镜像或者是直接 pull 下来的镜像能被称为顶层(top-level)镜像,并且每一个顶层镜像下面都隐藏了多个镜像层。

docker images –a

17.png

docker images –a 命令列出了所有的镜像,也可以说是列出了所有的可读层。如果你想要查看某一个 image-id 下的所有层,可以使用 docker history 来查看。

docker stop

18.png

docker stop 命令会向运行中的容器发送一个 SIGTERM 的信号,然后停止所有的进程。

docker kill

19.png

docker kill 命令向所有运行在容器中的进程发送了一个不友好的 SIGKILL 信号。

docker pause

20.png

docker stop 和 docker kill 命令会发送 UNIX 的信号给运行中的进程,docker pause 命令则不一样,它利用了 cgroups 的特性将运行中的进程空间暂停。具体的内部原理你可以在这里找到:https://www.kernel.org/doc/Doc ... m.txt,但是这种方式的不足之处在于发送一个 SIGTSTP 信号对于进程来说不够简单易懂,以至于不能够让所有进程暂停。

docker rm

21.png

docker rm 命令会移除构成容器的可读写层。注意,这个命令只能对非运行态容器执行。

docker rmi

22.png

docker rmi 命令会移除构成镜像的一个只读层。你只能够使用 docker rmi 来移除最顶层(top level layer)(也可以说是镜像),你也可以使用-f 参数来强制删除中间的只读层。

docker commit

23.png

docker commit 命令将容器的可读写层转换为一个只读层,这样就把一个容器转换成了不可变的镜像。
24.png

docker build

25.png

docker build 命令非常有趣,它会反复的执行多个命令。
26.png

我们从上图可以看到,build 命令根据 Dockerfile 文件中的 FROM 指令获取到镜像,然后重复地 1)run(create 和 start)、2)修改、3)commit。在循环中的每一步都会生成一个新的层,因此许多新的层会被创建。

docker exec

27.png

docker exec 命令会在运行中的容器执行一个新进程。

docker inspect or

28.png

docker inspect 命令会提取出容器或者镜像最顶层的元数据。

docker save

29.png

docker save 命令会创建一个镜像的压缩文件,这个文件能够在另外一个主机的 Docker 上使用。和 export 命令不同,这个命令为每一个层都保存了它们的元数据。这个命令只能对镜像生效。

docker export

30.png

docker export 命令创建一个 tar 文件,并且移除了元数据和不必要的层,将多个层整合成了一个层,只保存了当前统一视角看到的内容(译者注:expoxt 后的容器再 import 到 Docker 中,通过 docker images –tree 命令只能看到一个镜像;而 save 后的镜像则不同,它能够看到这个镜像的历史镜像)。

docker history

31.png

docker history 命令递归地输出指定镜像的历史镜像。

结论

我希望你们能喜欢这篇文章。还有其他许多的命令(pull,search,restart,attach 等)我没有提及,但是我相信通过阅读这篇文章,大部分的 Docker 命令都能够被很好理解。我仅仅学习了 Docker 两个星期,因此,如果我有什么地方说的不好,欢迎大家指出。

  • Docker

    Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的操作系统上。容器完全使用沙箱机制,几乎没有性能开销,可以很容易地在机器和数据中心中运行。

    490 引用 • 916 回帖 • 2 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...