注册 登录
  • 欢迎访问"运维那点事",推荐使用Google浏览器访问,可以扫码关注本站的"微信公众号"。
  • 如果您觉得本站对你有帮助,那么可以扫码捐助以帮助本站更好地发展。

Docker:容器数据管理

Docker 彭东稳 6918次浏览 已收录 1个评论

Docker Volumes

Volume可以将容器以及容器产生的数据分离开来,这样,当你使用docker rm my_container删除容器时,不会影响相关的数据。

Docker的难点之一就是Volume的使用,这也是很多人都会问到的问题。所以让我们一起来深入看看Docker Volume是如何工作的。很多人都对Volume有一个误解,他们认为Volume是为了持久化。如此想法是因为他们觉得容器不能持久化,所以Volume应该是为了满足这个需求而设计的。其实容器会一直存在,除非你删除它们。这可能来自于容器不是持久的想法,这样确实是不对的。容器是持久的,直到你删除他们,并且你只能这样做:

如果你没有执行此命令,那么你的容器会一直存在,依旧可以启动、停止等。如果你找不到你的容器,可以运行此命令:

docker ps只能显示正在运行的容器,但是容器也会处于停止状态,这种情况下,上面的命令(-a参数会列出所有的容器)会显示所有的容器,无论它们处于什么状态。

综上,再次声明:Volume并不是为了持久化。而Volume可以使用以下两种方式创建:

1)在Dockerfile中指定VOLUME /data。

2)执行docker run -v /data命令来指定。

无论哪种方式都是做了同样的事情。它们告诉Docker在主机上创建一个目录(默认情况下是在/var/lib/docker下),然后将其挂载到指定的路径(例子中是:/data)。

想要了解Docker Volume,首先我们需要知道Docker的文件系统是如何工作的。Docker镜像是由多个文件系统(只读层)叠加而成。当我们启动一个容器的时候,Docker会加载只读镜像层并在其上添加一个读写层。如果运行中的容器修改了现有的一个已经存在的文件,那该文件将会从读写层下面的只读层复制到读写层,该文件的只读版本仍然存在,只是已经被读写层中该文件的副本所隐藏。当删除Docker容器,并通过该镜像重新启动时,之前的更改将会丢失。在Docker中,只读层及在顶部的读写层的组合被称为Union File System(联合文件系统)。

为了能够保存(持久化)数据以及共享容器间的数据,Docker提出了Volume的概念。简单来说,Volume就是目录或者文件,它可以绕过默认的联合文件系统,而以正常的文件或者目录的形式存在于宿主机上。为持续性或共享数据提供一些有用的功能:

1)数据卷可以在容器间共享和重用。

2)数据卷数据改变是直接修改的。

3)数据卷数据改变不会被包括在容器中。

4)数据卷是持续性的,直到没有容器使用它们。

我们可以通过两种方式来初始化Volume,这两种方式有些细小而又重要的差别。我们可以在运行时使用-v来声明Volume。

一、添加一个数据卷

你可以使用-v选项添加一个数据卷,或者可以使用多次-v选项为一个docker容器运行挂载多个数据卷。下面创建数据卷绑定到到新建容器,新建容器中会创建/data数据卷。

上面的命令会将/data挂载到容器中,并绕过联合文件系统,我们可以在主机上直接操作该目录。任何在该镜像/data路径的文件将会被复制到Volume。我们可以使用docker inspect命令找到Volume在主机上的存储位置:

这说明Docker把在/var/lib/docker/volumes下的某个目录挂载到了容器内的/data目录下,让我们从主机上添加文件到此文件夹下:

查看容器,会存在此文件:

只要将主机的目录挂载到容器的目录上,就会立即生效。我们可以在Dockerfile中通过使用VOLUME指令来达到相同的目的:

当正常删除使用该Volume的容器时,Volume本身不会受到影响,它可以一直存在下去。

你可以告诉Docker同时删除容器和其Volume:

二、挂载一个数据卷

但还有另一件只有-v参数能够做到而Dockerfile是做不到的事情就是在容器上挂载指定的主机目录。例如:

该命令将挂载主机的/data目录到容器内的/web目录上。任何在/data目录的文件都将会出现在容器内。这对于在主机和容器之间共享文件是非常有帮助的,例如挂载需要编译的源代码。为了保证可移植性(并不是所有的系统的主机目录都是可以用的),挂载主机目录不需要从Dockerfile指定。当使用-v参数时,镜像目录下的任何文件都不会被复制到Volume中。

默认挂载卷是可读写的,可以在挂载时指定只读

三、容器数据共享

如果要授权一个容器访问另一个容器的Volume,我们可以使用–volumes-from参数来执行docker run。

创建数据卷容器

使用–volumes-from选项在另一个容器中挂载/test卷。不管test容器是否运行,其它容器都可以挂载该容器数据卷,当然如果只是单独的数据卷是没必要运行容器的。

添加另一个容器。

也可以继承其它挂载有卷的容器。

四、备份、恢复容器数据

备份:如果你在用数据容器,那做备份容器数据是相当容易的。

启动一个新的容器并且从test_1容器中挂载卷,然后挂载当前目录到容器中为/bakcup,然后并备份/data目录中所有的数据为test.tar,执行完成之后删除容器–rm,此时备份就在当前的目录下,名为data.tar。

你可以恢复给同一个容器或者另外的容器,新建容器并解压备份文件到新的容器数据卷。

当然,备份容器数据还可以直接使用docker cp命令,如下:

五、删除数据卷

这个功能可能会更加重要,如果你已经使用docker rm来删除你的容器,那可能有很多的孤立的Volume仍在占用着空间。

Volume只有在下列情况下才能被删除:

1)该容器是用docker rm -fv命令来删除的(-v是必不可少的)。

2)docker run中使用了–rm参数。

即使用以上两种命令,也只能删除没有容器连接的Volume,连接到用户指定主机目录的Volume永远不会被docker删除。

除非你已经很小心的,总是像这样来运行容器,否则你将会在/var/lib/docker/vfs/dir目录下得到一些僵尸文件和目录,并且还不容易说出它们到底代表什么。

Dockerfiles里的VOLUME

正如前面提到的,Dockerfile中的VOLUME指令也可以做同样的事情,类似docker run命令中的-v参数(除了你不能在Dockerfile指定主机路径)。也正因为如此,构建镜像时可以得到惊奇的效果。

在Dockerfile中的每个命令都会创建一个新的用于运行指定命令的容器,并将容器提交到镜像,每一步都是在前一步的基础上构建。因此在Dockerfile中ENV FOO=bar等同于:

下面让我们来看看这个Dockerfile的例子发生了什么:

我们期待的是Docker创建一个名为my_debian并且Volume是/foo/bar的镜像,以及在/foo/bar/baz下添加了一个空文件,但是让我们看看等同的CLI命令行实际上做了哪些:

真实过程可能并不是这样,但是类似。

在这里,/foo/bar会首先创建,所以我们每次通过这个镜像启动一个容器,都会有一个空的/foo/bar目录。正如前面所说,Dockerfile中每个命令都会创建一个新容器。也就是说,每次都会创建一个新的Volume。由于例子的Dockerfile中是先指定Volume的,所以当执行touch /foo/bar/baz命令的容器创建时,一个Volume会被挂载到/foo/bar,然后baz才能被写入此Volume,而不是实际的容器或镜像的文件系统内。

所以,牢记Dockerfile中VOLUME指令的位置,因为它在你的镜像内创建了不可改变的目录。

docker cp(#8509),docker commit和docker export还不支持Volume(在文章截稿时)。

目前,在容器的创建/销毁期间来管理Volume(创建/销毁)是唯一的方式,这有点古怪,因为Volume是为了从容器的生命周期中分离容器内的数据与。Docker团队正在处理这个问题,但尚未合并(#8484)。

参考文档:


如果您觉得本站对你有帮助,那么可以支付宝扫码捐助以帮助本站更好地发展,在此谢过。
喜欢 (1)or分享 (0)
关于作者:

您必须 登录 才能发表评论!

(1)个小伙伴在吐槽
  1. 原文: "这样确实是不对的。容器是持久的,直到你删除他们,并且你只能这样做" 作者您好,容器如果不主观删除确实是持久的,您也说到容器的image是只读层,在容器产生的数据都记录在可写层。如果容器发生重启,在可写层的数据会丢失,除非commit成只读的imaged,或者做volume持久化数据。我太理解 既然volume可以做持久化。如果面试官问我,volume的目的是什么,我该如何回答呢。望指教
    w7767852932019-02-11 12:23 (7天前) Windows 10 | Chrome 71.0.3578.80