Docker存储卷配置详细介绍

发布于:2023-01-22 ⋅ 阅读:(18) ⋅ 点赞:(0) ⋅ 评论:(0)

COW机制

Docker镜像由多个只读层叠加而成,启动容器时,Docker会加载只读镜像层并在镜像栈顶部添加一个读写层。(在原来我们制作镜像的过程中加入了一些插件或数据,在第二层使用镜像创建另外一个的容器时容器的数据会保持第三层的读写层,可以进行读写、删(但删除只表面删除,镜像原内容依然存在)

如果运行中的容器修改了现有的一个已经存在的文件,那么该文件将会从读写层下面的只读层复制到读写层,但该原文件的只读版本依然存在只是已经读写层中该文件的副本所隐藏,这就是“写时复制(COW)”机制。

在可写层写入东西时候,会从原本的只读层拉入数据给读写层操作

对于这种方式来说,我们去访问一个文件,修改和删除等一类的操作,其效率会非常的低,因为隔着很多层镜像。(构建镜像时最好减少保持层数的叠加)

[root@localhost ~]# docker pull centos      //这里拉取可见有四层
Using default tag: latest
latest: Pulling from library/centos
a1d0c7532777: Pull complete 
Digest: sha256:a27fd8080b517143cbbbab9dfb7c8571c40d67d534bbdee55bd6c473f432b177
Status: Downloaded newer image for centos:latest
docker.io/library/centos:latest

而要想绕过这种限制,我们可以通过使用存储卷的机制来实现。

什么是存储卷

存储卷就是将宿主机的本地文件系统中存在的某个目录直接与容器内部的文件系统上的某一目录建立绑定关系。这就意味着,当我们在容器中的这个目录下写入数据时,容器会将其内容直接写入到宿主机上与此容器建立了绑定关系的目录。

在这里插入图片描述

在宿主机上的这个与容器形成绑定关系的目录被称作存储卷。

使用存储卷的好处

如果容器中跑的进程的所有有效数据都保存在存储卷中,从而脱离容器自身文件系统之后,带来的好处是当容器关闭甚至被删除时只要不删除与此容器绑定的在宿主机上的这个存储目录,我们就不用担心数据丢失了。因此就可以实现数据持久,脱离容器的生命周期而持久。

我们通过这种方式管理容器,容器就可以脱离主机的限制,可以在任意一台部署了docker的主机上跑容器,而其数据则可以置于一个共享存储文件系统上,比如nfs。

Docker的存储卷默认情况下是使用其所在的宿主机上的本地文件系统目录的,也就是说宿主机上有一块属于自己的硬盘,这个硬盘并没有共享给其他的Docker主机,而在这台主机上启动的容器所使用的存储卷是关联到此宿主机硬盘上的某个目录之上。

这就意味着容器在这台主机上停止运行或者被删除了再重建,只要关联到硬盘上的这个目录下,那么其数据还存在。但如果在另一台主机上启动一个新容器,那么数据就没了。而如果在创建容器的时候我们手动的将容器的数据挂载到一台nfs服务器上,那么这个问题就不再是问题了。

为什么要用存储卷

关闭并重启容器,其数据不受影响,但删除Docker容器,则其更改将会全部丢失。

因此Docker存在的问题有:

>存储于联合挂载文件系统中,不易于宿主机访问
容器间数据共享不便
删除容器其数据会丢失

而要解决这些问题,解决方案就是使用存储卷。

存储卷管理方式

存储卷(Data Volume)于容器初始化时被自动创建,由base image提供的卷中的数据会于此期间完成复制。

Volume的初衷是独立于容器的生命周期实现数据持久化,因此删除容器之时既不会删除卷,也不会对未被引用的卷做垃圾回收操作。

存储卷为Docker提供了独立于容器的数据管理机制,我们可以把镜像想象成静态文件,例如“程序”,把卷类比为动态内容,例如“数据”。所以镜像可以重用,而卷则可以共享。

卷实现了“程序(镜像)”和“数据(卷)”的分离,以及“程序(镜像)”和“制作镜像的主机”的分离,用户制作镜像时无须再考虑镜像运行的容器所在的主机的环境。
容器可以任意创建N个,并吧数据放在挂载中。

在这里插入图片描述

存储卷的分类

Docker有两种类型的卷,每种类型都在容器中存在一个挂载点,但其在宿主机上的位置有所不同:

绑定装载卷
指向主机文件系统上用户指定位置的卷

Docker 管理的卷
Docker 守护程序在主机文件系统的一部分中创建托管卷,该部分归 Docker 所有
在这里插入图片描述

容器数据管理

用户在使用Docker的过程中,往往需要能查看容器内应用产生的数据,或者需要把容器内的数据进行备份,甚至多个容器之间进行数据的共享,这必然涉及容器的数据管理操作。

容器中管理数据主要有两种方式:

	数据卷(Data Volumes)
	数据卷容器(Data Volumes Containers)

容器Volume使用语法:
Docker-managed volume

docker run -it --name CONTAINER_NAME -v VOLUMEDIR IMAGE_NAME

绑定装载卷
-v 指定某个目录为存储卷的位置

在宿主机上使用 inspect
Mounts:上查看容器中的挂载点
source:容器的源来着于那里,挂载在宿主机的此目录
可进行添加或删除
当添加完后删除容器
宿主机的数据也应该不存在了

docker run -it --name CONTAINER_NAME -v HOSTDIR:VOLUMEDIR IMAGE_NAME

//容器
[root@localhost ~]# docker run -it --name web -v /opt centos
[root@b3a5d1ef339e /]# ip a
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN group default qlen 1000
    link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
    inet 127.0.0.1/8 scope host lo
       valid_lft forever preferred_lft forever
26: eth0@if27: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc noqueue state UP group default 
    link/ether 02:42:ac:11:00:02 brd ff:ff:ff:ff:ff:ff link-netnsid 0
    inet 172.17.0.2/16 brd 172.17.255.255 scope global eth0
       valid_lft forever preferred_lft forever

//宿主机上查看信息
[root@localhost ~]# docker inspect web
                "Source": "/var/lib/docker/volumes/7c1694528366bfe42cd5c50a1507d3eb70fd4129141fcdd6eadd8c52af4d42fd/_data",
                "Destination": "/opt",


//容器
[root@b3a5d1ef339e /]# ls
bin  etc   lib	  lost+found  mnt  proc  run   srv  tmp  var
dev  home  lib64  media       opt  root  sbin  sys  usr
[root@b3a5d1ef339e /]# cd /opt/
[root@b3a5d1ef339e opt]# ls
[root@b3a5d1ef339e opt]# mkdir ww
[root@b3a5d1ef339e opt]# mkdir rr
[root@b3a5d1ef339e opt]# ls
rr  ww

//宿主机
[root@localhost ~]# cd /var/lib/docker/volumes/7c1694528366bfe42cd5c50a1507d3eb70fd4129141fcdd6eadd8c52af4d42fd/
[root@localhost 7c1694528366bfe42cd5c50a1507d3eb70fd4129141fcdd6eadd8c52af4d42fd]# ls
_data
[root@localhost _data]# ls        //可以看到已经共享了存储卷
rr  ww

在容器中使用数据卷

在容器内创建一个数据卷

下面使用centos镜像创建一个web容器,并创建一个数据卷挂载到容器的/webapp目录下:

语法:
docker run -it --name CONTAINER_NAME -v VOLUMEDIR IMAGE_NAME

//创建一个容器并挂载个webapp的目录。此时这个目录只能单独存在,宿主机无法共享查看
[root@localhost ~]# docker run -d -it --name web -v /webapp centos
c5633ed360cf06ee6be321a0f5e89e1166d60f56d3e9bcbee97420542ed3905b
[root@localhost ~]# ls
anaconda-ks.cfg  pass
[root@localhost ~]# docker exec -it web /bin/bash
[root@c5633ed360cf /]# ls
bin  etc   lib	  lost+found  mnt  proc  run   srv  tmp  var
dev  home  lib64  media       opt  root  sbin  sys  usr  webapp
[root@c5633ed360cf /]# cd webapp/
[root@c5633ed360cf webapp]# ls


//宿主机
[root@localhost /]# ls
bin   dev  home  lib64  media  opt   root  sbin  sys  usr
boot  etc  lib   lty    mnt    proc  run   srv   tmp  var

需要以下在宿主机和容器中接:挂载目录才能实现数据通信

挂载一个主机目录作为数据卷

-v 后面首先接的是 “宿主机:容器 ” 的绝对路径进行同步

在容器里面动文件的话
宿主机可以同步

//容器
[root@localhost opt]# docker run -it --name web -v /opt/lty:/webapp centos
[root@1310fb1a6e05 /]# ls
bin  etc   lib	  lost+found  mnt  proc  run   srv  tmp  var
dev  home  lib64  media       opt  root  sbin  sys  usr  webapp
[root@1310fb1a6e05 /]# cd webapp/
[root@1310fb1a6e05 webapp]# ls
[root@1310fb1a6e05 webapp]# mkdir pp
[root@1310fb1a6e05 webapp]# touch qq
[root@1310fb1a6e05 webapp]# ls
pp  qq


//宿主机查看同步
[root@localhost opt]# cd /opt/lty/
[root@localhost lty]# ls
pp  qq
[root@localhos

//宿主机添加一个文件
[root@localhost lty]# touch hh
[root@localhost lty]# ls
hh  pp  qq
//容器
[root@1310fb1a6e05 webapp]# ls
hh  pp	qq


//这时删除容器,看宿主机的存储卷数据是否还会存在

[root@localhost lty]# docker ps -a
CONTAINER ID   IMAGE     COMMAND       CREATED          STATUS          PORTS     NAMES
1310fb1a6e05   centos    "/bin/bash"   18 minutes ago   Up 18 minutes             web
[root@localhost lty]# docker rm -f web
web
[root@localhost ~]# docker ps -a
CONTAINER ID   IMAGE     COMMAND   CREATED   STATUS    PORTS     NAMES

//宿主机数据依然存在
[root@localhost lty]# cd
[root@localhost ~]# cd /opt/lty/
[root@localhost lty]# ls
hh  pp  qq

上面的命令加载主机的目录到容器的目录:
这个功能在进行测试的时候非常方便,比如用户可以放置一些程序或数据到本地目录中,然后在容器内运行和使用。 另外,本地目录的路径必须是绝对路径,如果目录不存在,Docker会自动创建。/opt/lty:webapp

Docker挂载数据卷的默认权限是读写(rw),用户也可以通过(ro)指定为只读:

[root@localhost ~]# docker run -it --name web -v /opt/haa:/webapp:ro centos
[root@eed23c6afad8 /]# ls
bin  etc   lib	  lost+found  mnt  proc  run   srv  tmp  var
dev  home  lib64  media       opt  root  sbin  sys  usr  webapp
[root@eed23c6afad8 /]# cd webapp/
[root@eed23c6afad8 webapp]# ls
[root@eed23c6afad8 webapp]# touch gh
touch: cannot touch 'gh': Read-only file system
加了:ro以后,容器内挂载的数据卷的数据就无法修改和添加了。


//宿主机添加实验
[root@localhost haa]# cd /opt/haa/
[root@localhost haa]# ls
[root@localhost haa]# touch pp
[root@localhost haa]# ls
pp
[root@localhost haa]# touch vbn
[root@localhost haa]# ls
pp  vbn


//容器中查看
[root@eed23c6afad8 webapp]# ls
pp  vbn

挂载一个本地主机文件作为数据卷
-v选项也可以从主机挂载单个文件到容器中作为数据卷:

[root@localhost ~]# docker run -it --rm -v ~/.bash_history:/.bash_history centos /bin/bash

容器的家目录写入绝对路径

~/。bash //指定当前的root家目录下的隐藏文件,印射到容器的目录
这样就可以记录在容器输入过的命令历史了。

如果直接挂载一个文件到容器,使用文件编辑工具,包括vi或者sed去修改文件内容的时候,可能会造成inode的改变,这样将会导致错误。 所以推荐的方式是直接挂载文件所在的目录。

//容器
[root@localhost ~]# docker run -it --name web  -v ~/.bash_history:/root/.bash_history centos /bin/bash
[root@52c741ea55bc ~]# ls -a
.	      .bash_profile  .tcshrc		bash_history
..	      .bashrc	     anaconda-ks.cfg	original-ks.cfg
.bash_logout  .cshrc	     anaconda-post.log


//宿主机
[root@localhost ~]# ls -a
.                a.txt          .bash_profile  .mysql_history  .viminfo
..               .bash_history  .bashrc        pass
anaconda-ks.cfg  .bash_logout   .cshrc         .tcshrc
  432  ls
  433  cd ..
  434  ls
  435  cd _data/
  436  ls
  437  exit
  438  history 
[root@localhost ~]#          //查看历史同步信息

//容器
ls
cd ..
ls
cd _data/
ls
exit             //可见这里的容器与宿主机数据缺少一个“history”命令

分析:
如果仅仅是这样的话当进行挂载的时候,宿主机的文件内容需要有数据
这样在容器中就可以看到创建前的数据,都是当后面在宿主机添加内容后,容器中的同步数据不会发生关闭

容器同步 当前/.a.txt:rw 给一个rw既可实时同步读写试试看

//容器
[root@localhost ~]# docker run -it --name ll -v /root/a.txt:/a.txt:rw centos
[root@82cb8a3fbbef /]# ls
a.txt  dev  home  lib64       media  opt   root  sbin  sys  usr
bin    etc  lib   lost+found  mnt    proc  run	 srv   tmp  var

//宿主机
[root@localhost ~]# ls
anaconda-ks.cfg  a.txt  pass
[root@localhost ~]# vi a.txt 
[root@localhost ~]# cat a.txt 
hello world


//容器
[root@82cb8a3fbbef /]# cat a.txt 
hello world


写入数据

数据卷容器

如果用户需要在容器之间共享一些持续更新的数据,最简单的方式是使用数据卷容器。 数据卷容器其实就是一个普通的容器,专门用它提供数据卷供其他容器挂载使用,方法如下:

首先,创建一个数据卷容器dbdata,并在其中创建一个数据卷挂载到/dbdata:

[root@localhost ~]# docker run -it -it --name lty -v /hh centos
[root@a6a656c372f8 /]# ls
bin  etc  home	lib64	    media  opt	 root  sbin  sys  usr
dev  hh   lib	lost+found  mnt    proc  run   srv   tmp  var
[root@a6a656c372f8 /]# cd hh/
[root@a6a656c372f8 hh]# ls
[root@a6a656c372f8 hh]# mkdir comn
[root@a6a656c372f8 hh]# ls
comn

然后可以在其他容器中使用–volumes-from来挂载dbdata容器中的数据卷,例如创建db1和db2两个容器,并从dbdata容器挂载数据卷:后面接的是之前已经创建的容器名称,既而创建后可以较快的访问相同的数据,可以进行增删改查,数据是同步的

[root@localhost ~]# docker ps -a
CONTAINER ID   IMAGE     COMMAND       CREATED          STATUS          PORTS     NAMES
ea7efdc7ed41   centos    "/bin/bash"   7 minutes ago    Up 7 minutes              web2
12a44726cd81   centos    "/bin/bash"   8 minutes ago    Up 8 minutes              web1
a6a656c372f8   centos    "/bin/bash"   13 minutes ago   Up 13 minutes             lty


//添加后都可以看到基于lty容器时挂载的“hh”卷
[root@localhost ~]# docker run -it --name web1 --volumes-from lty centos
[root@12a44726cd81 /]# ls
bin  etc  home	lib64	    media  opt	 root  sbin  sys  usr
dev  hh   lib	lost+found  mnt    proc  run   srv   tmp  var

[root@localhost ~]# docker run -it --name web2 --volumes-from lty centos
[root@ea7efdc7ed41 /]# ls
bin  etc  home	lib64	    media  opt	 root  sbin  sys  usr
dev  hh   lib	lost+found  mnt    proc  run   srv   tmp  var


//查看实时同步
lty
[root@a6a656c372f8 hh]# mkdir comn
[root@a6a656c372f8 hh]# ls
comn
[root@a6a656c372f8 hh]# mkdir ppp
[root@a6a656c372f8 hh]# ls
comn  ppp


//web1
[root@12a44726cd81 hh]# ls
comn  ppp


//web2
[root@ea7efdc7ed41 hh]# ls
comn  ppp

可以多次使用–volumes-from参数来从多个容器挂载多个数据卷。 还可以从其他已挂载了容器卷的容器来挂载数据卷:

[root@localhost ~]# docker run -d --name web3 --volumes-from web1 centos

使用–volumes-from参数所挂载数据卷的容器自身并不需要保持在运行状态。

如果删除了挂载的容器(包括dbdata、db1和db2),数据卷并不会被自动删除。 如果要删除一个数据卷,必须在删除最后一个还挂载着它的容器时显式使用docker rm -v命令来指定同时删除关联的容器。

容器删除时进行一个-V 才能对数据进行清除

[root@localhost ~]# docker rm -f  -v web1 web2 lty
web1
web2
lty
[root@localhost ~]# docker ps -a
CONTAINER ID   IMAGE     COMMAND   CREATED   STATUS    PORTS     NAMES

利用数据卷容器迁移数据

可以利用数据卷容器对其中的数据卷进行备份、恢复,以实现数据的迁移。
备份

//这里只指定一个h1的容器挂载点是/data
[root@localhost ~]# docker ps -a
CONTAINER ID   IMAGE     COMMAND   CREATED   STATUS    PORTS     NAMES
[root@localhost ~]# docker run -it --name h1 -v /data centos
[root@70cfb3521c65 /]# ls
bin   dev  home  lib64	     media  opt   root	sbin  sys  usr
data  etc  lib	 lost+found  mnt    proc  run	srv   tmp  var
[root@70cfb3521c65 /]# cd data/
[root@70cfb3521c65 data]# touch qw eqwr dad        //插入数据,启动备份状态
[root@70cfb3521c65 data]# ls
dad  eqwr  qw

[root@localhost ~]# docker run -it --name h2 --volumes-from h1 -v $(pwd):/backup centos  tar cvf /backup/backup.tar  /data
tar: Removing leading `/' from member names
/data/
/data/qw
/data/eqwr
/data/dad
[root@localhost ~]# docker ps
CONTAINER ID   IMAGE     COMMAND       CREATED         STATUS         PORTS     NAMES
70cfb3521c65   centos    "/bin/bash"   5 minutes ago   Up 5 minutes             h1

这个命令稍微有点复杂,具体分析下。
首先利用centos镜像创建了一个容器h1。 使用--volumes-from /dbdata参数来让h1容器挂载dbdata容器的数据卷(即dbdata数据卷); 使用-v $(pwd):/backup参数来挂载宿主机的当前目录到容器的/backup(也就是/data挂载点位置)目录。

h2容器启动后,使用了tar cvf /backup/backup.tar /dbdata命令来将/dbdata下内容备份为容器内的/backup/backup.tar, 
 即宿主主机当前目录下的backup.tar。
[root@localhost ~]# ls
anaconda-ks.cfg  a.txt  backup.tar  pass


//宿主机
//当外面生成备份命令的时候,因为数值接的是打包命令所以容器不会立刻运行起来
[root@localhost ~]# docker ps -a
CONTAINER ID   IMAGE     COMMAND                  CREATED              STATUS                          PORTS     NAMES
6658d67330ee   centos    "tar cvf /backup/bac…"   About a minute ago   Exited (0) About a minute ago             h2
[root@localhost ~]# ls
anaconda-ks.cfg  a.txt  backup.tar  pass

恢复
//由于我们之前已经创建了“h1 h2”的存储卷,宿主机上也保存了/data时的存储包

这时我们在创建一个h3的容器 重新创建一个已/data/的挂载点

//我们之前在h1容器的时候/data这个挂载点已经有了一些数据
而现在新创建的h3只为了保存一下数据目录,并不着急进行数据恢复
[root@localhost ~]# docker run -it --name h3 -v /data centos
[root@c4023f65b1ab /]# ls
bin   dev  home  lib64	     media  opt   root	sbin  sys  usr
data  etc  lib	 lost+found  mnt    proc  run	srv   tmp  var
[root@c4023f65b1ab /]# cd data/
[root@c4023f65b1ab data]# ls

//这时我们在进行h4容器的创建,里面的参数挂载点是基于h3中的/data挂载目录,而至于恢复数据依靠在宿主机创建的/backup.tar安装包导入h1时插入的数据
[root@localhost ~]# docker ps -a
CONTAINER ID   IMAGE     COMMAND                  CREATED          STATUS                      PORTS     NAMES
c4023f65b1ab   centos    "/bin/bash"              20 minutes ago   Up 20 minutes                         h3
6658d67330ee   centos    "tar cvf /backup/bac…"   24 minutes ago   Exited (0) 24 minutes ago             h2
70cfb3521c65   centos    "/bin/bash"              29 minutes ago   Up 29 minutes                         h1

//创建h4
[root@localhost ~]# docker run -it --name h4 --volumes-from h3 -v $(pwd):/backup  centos  tar xf  /backup/backup.tar
//可见h4并没有启动,只是承担了恢复数据的责任
[root@localhost ~]# docker ps -a
CONTAINER ID   IMAGE     COMMAND                  CREATED          STATUS                      PORTS     NAMES
66fc00245935   centos    "tar xf /backup/back…"   19 seconds ago   Exited (0) 18 seconds ago             h4
c4023f65b1ab   centos    "/bin/bash"              27 minutes ago   Up 27 minutes                         h3
6658d67330ee   centos    "tar cvf /backup/bac…"   31 minutes ago   Exited (0) 31 minutes ago             h2
70cfb3521c65   centos    "/bin/bash"              37 minutes ago   Up 37 minutes                         h1

//这里进入h3查看恢复数据,h4只是启恢复
[root@localhost ~]# docker exec -it h3 /bin/bash
[root@c4023f65b1ab /]# ls
bin   dev  home  lib64	     media  opt   root	sbin  sys  usr
data  etc  lib	 lost+found  mnt    proc  run	srv   tmp  var
[root@c4023f65b1ab /]# cd /data/
[root@c4023f65b1ab data]# ls
dad  eqwr  qw                               //成功恢复