Docker 网络与资源控制-易微帮

Docker使用Linux桥接，在宿主机虚拟一个Docker容器网桥(docker0)，Docker启动一个容器时会根据Docker网桥的网段分配给容器一个IP地址，称为Container-IP，同时Docker网桥是每个容器的默认网关。因为在同一宿主机内的容器都接入同一个网桥，这样容器之间就能够通过容器的 Container-IP 直接通信。

Docker网桥是宿主机虚拟出来的，并不是真实存在的网络设备，外部网络是无法寻址到的，这也意味着外部网络无法直接通过 Container-IP 访问到容器。如果容器希望外部访问能够访问到，可以通过映射容器端口到宿主主机（端口映射），即 docker run 创建容器时候通过 -p 或 -P 参数来启用，访问容器的时候就通过[宿主机IP]:[容器端口]访问容器。

端口映射

docker run -d --name test1 -P nginx

#随机映射端口（从32768开始）

docker run -d --name test2 -p 41000:80 nginx

#指定映射端口

[root@ha01 opt]# docker run -d --name test1 -p 41000:80 nginx

[root@ha01 opt]# docker ps -a
CONTAINER ID   IMAGE          COMMAND                   CREATED          STATUS                      PORTS                                     NAMES
140b262d52d1   nginx          "/docker-entrypoint.…"   36 minutes ago   Up 36 minutes               0.0.0.0:41000->80/tcp, :::41000->80/tcp   test1


注意：如果使用的是从修改过的容器中导出的镜像文件会报错。没有会自动下载。

查看容器的输出和日志信息

docker logs 容器的ID/名称

如果容器中nginx或tomcat的服务挂了，日志会不停生成导致资源被大量占用。甚至所有服务都会挂。

Docker 的网络模式：

●Host：容器将不会虚拟出自己的网卡，配置自己的IP等，而是使用宿主机的IP和端口。

与宿主机共享网络名称空间

●Container：创建的容器不会创建自己的网卡，配置自己的IP，而是和一个指定的容器共享IP、端口范围。

多个容器之间共享一个network namespace（命名空间）

●None：该模式关闭了容器的网络功能。

●Bridge：默认为该模式，此模式会为每一个容器分配、设置IP等，并将容器连接到一个docker0虚拟网桥，通过docker0网桥以及iptables nat 表配置与宿主机通信。

默认模式通过VETH 对接 docker0 网桥，网桥分配给容器IP，同时docker0作为局域网内容器的网关，最后与宿主机网卡进行通讯。

●自定义网络

docker允许用户创建自己的定义的网络，用户可以定义的网络范围、子网、路由等参数，这种类型网络使用用户可以更好地对容器网络进行控住和隔离

(生产业务需求;注:根据甲方指定或领导指定)

根据业务需求指定静态IP地址

安装Docker时，它会自动创建三个网络，bridge（创建容器默认连接到此网络）、 none 、host

docker network ls 或 docker network list #查看docker网络列表

指定格式

使用docker run创建Docker容器时，可以用 --net 或 --network 选项指定容器的网络模式

●host模式：使用 --net=host 指定。
●none模式：使用 --net=none 指定。
●container模式：使用 --net=container:NAME_or_ID 指定。
●bridge模式：使用 --net=bridge 指定，默认设置，可省略。

网络模式详解：

1．host模式

相当于Vmware中的桥接模式，与宿主机在同一个网络中，但没有独立IP地址。

Docker使用了Linux的Namespaces技术来进行资源隔离，如PID Namespace隔离进程，Mount Namespace隔离文件系统，Network Namespace隔离网络等。

一个Network Namespace提供了一份独立的网络环境，包括网卡、路由、iptable规则等都与其他的Network Namespace隔离。一个Docker容器一般会分配一个独立的Network Namespace。

但如果启动容器的时候使用host模式，那么这个容器将不会获得一个独立的Network Namespace，而是和宿主机共用一个Network Namespace。容器将不会虚拟出自己的网卡、配置自己的IP等，而是使用宿主机的IP和端口。

docker run -d --name test2 --net=host nginx:latest

如何查看network是host模式的容器？

docker ps --filter "network=host"

2．container模式

在理解了host模式后，这个模式也就好理解了。这个模式指定新创建的容器和已经存在的一个容器共享一个Network Namespace，而不是和宿主机共享。

新创建的容器不会创建自己的网卡，配置自己的IP，而是和一个指定的容器共享IP、端口范围等。同样，两个容器除了网络方面，其他的如文件系统、进程列表等还是隔离的。两个容器的进程可以通过lo网卡设备通信。

实验实例：

[root@ha01 opt]#docker run -itd --name test3 centos:7 /bin/bash

[root@ha01 opt]#docker ps -a
CONTAINER ID   IMAGE          COMMAND                   CREATED          STATUS                     PORTS                                     NAMES
10590fbd71b4   centos:7       "/bin/bash"               2 seconds ago    Up 1 second                                                          test3

[root@ha01 opt]#docker inspect -f '{{.State.Pid}}' test3    #查看容器进程号
98664


[root@ha01 opt]#ll /proc/98664/ns        #查看容器的进程、网络、文件系统等命名空间编号
总用量 0
lrwxrwxrwx. 1 root root 0 4月  24 15:51 ipc -> ipc:[4026532758]
lrwxrwxrwx. 1 root root 0 4月  24 15:51 mnt -> mnt:[4026532756]
lrwxrwxrwx. 1 root root 0 4月  24 15:28 net -> net:[4026532761]  # net后面是网络编号
lrwxrwxrwx. 1 root root 0 4月  24 15:51 pid -> pid:[4026532759]
lrwxrwxrwx. 1 root root 0 4月  24 15:51 user -> user:[4026531837]
lrwxrwxrwx. 1 root root 0 4月  24 15:51 uts -> uts:[4026532757]


创建并启动名称 test4 网络模式为container的容器， 指定 共享 test3 的IP地址

docker run -itd --name test4 --net=container:test3 centos:7 /bin/bash

或者是

docker run -itd --name test4 --net=container:10590fbd71b4 centos:7 /bin/bash


[root@ha01 opt]#docker ps -a
CONTAINER ID   IMAGE          COMMAND                   CREATED          STATUS                      PORTS                                     NAMES
3ca277cdfdd2   centos:7       "/bin/bash"               4 seconds ago    Up 3 seconds                                                          test4
10590fbd71b4   centos:7       "/bin/bash"               29 minutes ago   Up 29 minutes                                                         test3


[root@ha01 opt]#docker inspect -f '{{.State.Pid}}' test4    #查看容器进程号
104977


[root@ha01 opt]#ll /proc/104977/ns       #查看可以发现两个容器的 net namespace 编号相同
总用量 0
lrwxrwxrwx. 1 root root 0 4月  24 16:06 ipc -> ipc:[4026532858]
lrwxrwxrwx. 1 root root 0 4月  24 16:06 mnt -> mnt:[4026532856]
lrwxrwxrwx. 1 root root 0 4月  24 16:06 net -> net:[4026532761]  #与test3的编号相同
lrwxrwxrwx. 1 root root 0 4月  24 16:06 pid -> pid:[4026532859]
lrwxrwxrwx. 1 root root 0 4月  24 16:06 user -> user:[4026531837]
lrwxrwxrwx. 1 root root 0 4月  24 16:06 uts -> uts:[4026532857]

注意：test3有8080端口的服务，test4就不能有这个服务，不然端口会发生冲突。因为它们使用的都是同一个IP不能出现相同的端口。

3．none模式

使用none模式，Docker容器拥有自己的Network Namespace，但是，并不为Docker容器进行任何网络配置。也就是说，这个Docker容器没有网卡、IP、路由等信息。这种网络模式下容器只有lo回环网络，没有其他网卡。这种类型的网络没有办法联网，封闭的网络能很好的保证容器的安全性。

无实际用处，生产环境基本不会使用。

docker run -itd --name test6 --net=none nginx:latest /bin/bash

4．bridge模式

bridge模式是docker的默认网络模式，不用--net参数，就是bridge模式。

docker run -itd --name test01 nginx:latest /bin/bash

相当于Vmware中的 nat 模式，容器使用独立network Namespace，并连接到docker0虚拟网卡。通过docker0网桥以及iptables nat表配置与宿主机通信，此模式会为每一个容器分配Network Namespace、设置IP等，并将一个主机上的 Docker 容器连接到一个虚拟网桥上。

（1）当Docker进程启动时，会在主机上创建一个名为docker0的虚拟网桥，此主机上启动的Docker容器会连接到这个虚拟网桥上。虚拟网桥的工作方式和物理交换机类似，这样主机上的所有容器就通过交换机连在了一个二层网络中。

（2）从docker0子网中分配一个IP给容器使用，并设置docker0的IP地址为容器的默认网关。在主机上创建一对虚拟网卡veth pair设备。veth设备总是成对出现的，它们组成了一个数据的通道，数据从一个设备进入，就会从另一个设备出来。因此，veth设备常用来连接两个网络设备。

（3）Docker将 veth pair 设备的一端放在新创建的容器中，并命名为 eth0（容器的网卡），另一端放在主机中，以 * 这样类似的名字命名，并将这个网络设备加入到 docker0 网桥中。可以通过 brctl show 命令查看。

（4）使用 docker run -p 时，docker实际是在iptables做了DNAT规则，实现端口转发功能。可以使用iptables -t nat -vnL 查看。

[root@ha01 ~]#docker ps -a
CONTAINER ID   IMAGE          COMMAND                   CREATED             STATUS                     PORTS                                     NAMES
6285eb4b34e4   nginx          "/docker-entrypoint.…"   3 hours ago         Up 3 hours                 0.0.0.0:41000->80/tcp, :::41000->80/tcp   test1

5．自定义网络

直接使用bridge模式，是无法支持指定IP运行docker的，例如执行以下命令就会报错

docker run -itd --name test7 --network bridge --ip 172.17.0.10 centos:7 /bin/bash

创建自定义网络

#可以先自定义网络，再使用指定IP运行docker

docker network create --subnet=172.18.0.0/16 --opt "com.docker.network.bridge.name"="docker1" mynet

docker1 为执行 ifconfig -a 命令时，显示的网卡名，如果不使用 --opt 参数指定此名称，那你在使用 ifconfig -a 命令查看网络信息时，看到的是类似 br-110eb56a0b22 这样的名字，这显然不怎么好记。

mynet 为执行 docker network list 命令时，显示的bridge网络模式名称。

指定IP地址：

docker run -itd --name test8 --net mynet --ip 172.18.0.11 centos:7 /bin/bash

docker网络总结：

docker网络模式

① host  容器使用宿主机的网络直接公开服务。 
这意味着你在容器中运行一个web服务，那么它就直接绑定到主机的网络接口上，
而不是通过docker进行任何网络转发

简短：与宿主机共享网络名称空间

docker run -d --name test2 --net=host nginx:latest


② container
这种模式允许容器去共享另一个容器网络命名空间，这说明两个容器可以使用相同的网络接口和IP地址，
他们共享的是同一网络命名空间。但不能出现相同的端口

简短：多个容器之间共享一个network namespace（命名空间）


docker run -itd --name test4 --net=container:test3 centos:7 /bin/bash
docker inspect -f '{{.State.Pid}}'  容器名称/id    #查看容器进程号
ll /proc/进程号/ns        #查看容器的进程、网络、文件系统等命名空间编号


③ none
是最简单的网络模式，此网络模式 将容器拥有自己的网络命名空间，但不会进行任何网络配置，
这实际给了用户完全的自主权来给自己配置容器的网络

简短：自闭空间

docker run -itd --name test6 --net=none nginx:latest /bin/bash



④ bridge  默认的网络模式
每个新创建的容器都将该网络分配一个P地址，此网络模式允许所有docker容器之间以及docker宿
主机之间进行互相通信

默认模式  通过VETH 对接 docker0 网桥 ，网桥分配给容器IP，同时docker0作为局域网内 
容器的网关，最后与宿主机网卡进行通讯。


docker run -itd --name test01 nginx:latest /bin/bash


⑤ user-defined network  自定义
docker允许用户创建自己的定义的网络，用户可以定义的网络范围、子网、路由 等参数，
这种类型网络使用用户可以更好地对容器网络进行控住和隔离
(生产业务需求;注:根据甲方指定或领导指定)
根据业务需求指定静态IP地址


docker network create --subnet=172.18.0.0/16 --opt "com.docker.network.bridge.name"="docker1" mynet
docker run -itd --name test8 --net mynet --ip 172.18.0.11 centos:7 /bin/bash   指定IP地址

二、资源控制

1．CPU 资源控制

cgroups，是一个非常强大的linux内核工具，他不仅可以限制被 namespace 隔离起来的资源，还可以为资源设置权重、计算使用量、操控进程启停等等。所以 cgroups（Control groups）实现了对资源的配额和度量。

资源限制就是为了防止容器占用资源过大导致所有服务崩溃。

cgroups有四大功能：
●资源限制：可以对任务使用的资源总额进行限制
●优先级分配：通过分配的cpu时间片数量以及磁盘IO带宽大小，实际上相当于控制了任务运行优先级
●资源统计：可以统计系统的资源使用量，如cpu时长，内存用量等
●任务控制：cgroup可以对任务执行挂起、恢复等操作

（1）设置CPU使用率上限

Linux通过CFS（Completely Fair Scheduler，完全公平调度器）来调度各个进程对CPU的使用。CFS默认的调度周期是100ms。
我们可以设置每个容器进程的调度周期，以及在这个周期内各个容器最多能使用多少 CPU 时间。

        使用 --cpu-period 即可设置调度周期，使用 --cpu-quota 即可设置在每个周期内容器能使用的CPU时间。两者可以配合使用。
        CFS 周期的有效范围是 1ms~1s，对应的 --cpu-period 的数值范围是 1000~1000000。周期100毫秒
        而容器的 CPU 配额必须不小于 1ms，即 --cpu-quota 的值必须 >= 1000。

docker run -itd --name ce1 centos:7 /bin/bash

[root@ha01 ~]#docker ps -a
CONTAINER ID   IMAGE          COMMAND                   CREATED          STATUS                     PORTS                                     NAMES
b8d87af5fd37   centos:7       "/bin/bash"               9 seconds ago    Up 8 seconds                                                         ce1


[root@ha01 ~]#cd /sys/fs/cgroup/cpu/docker/b8d87af5fd370d9a1f74de3aaf06de3f7e6cf85781bc12830c69d2f10c56bd7d/

cat cpu.cfs_quota_us 
-1
#cpu.cfs_quota_us：表示该cgroups限制占用的时间（微秒），默认为-1，表示不限制。 如果设为50000，
表示占用50000/100000=50%的CPU。


cat cpu.cfs_period_us 
100000
#cpu.cfs_period_us：cpu分配的周期(微秒，所以文件名中用 us 表示），默认为100000微秒。

压力测试：

docker exec -it ce1 /bin/bash   进入ce1 容器

yum install -y vim

vim /cpu.sh
#!/bin/bash
i=0
while true
do
let i++
done



chmod +x /cpu.sh
./cpu.sh


切到另一个终端 真实主机 界面上 使用 top 查看cpu使用情况。

可以看到默认情况下容器使用cpu上限是100%，我们给容器设置50%的比例分配CPU使用时间上限

docker run -itd --name test6 --cpu-quota 50000 centos:7 /bin/bash
#可以重新创建一个容器并设置限额

或者

cd /sys/fs/cgroup/cpu/docker/b8d87af5fd370d9a1f74de3aaf06de3f7e6cf85781bc12830c69d2f10c56bd7d/

echo 50000 > cpu.cfs_quota_us


操作完成后 进入容器内运行脚本，并到真实主机使用top查看cpu使用情况

（2）设置CPU资源占用比

（设置多个容器时才有效）

Docker 通过 --cpu-shares 指定 CPU 份额，默认值为1024，值为1024的倍数。

创建两个容器为 c1 和 c2，若只有这两个容器，设置容器的权重，使得c1和c2的CPU资源占比为1/3和2/3。

docker run -itd --name c1 --cpu-shares 512 centos:7
docker run -itd --name c2 --cpu-shares 1024 centos:7

#分别进入容器，进行压力测试

yum install -y epel-release
yum install -y stress
stress -c 4				#产生四个进程，每个进程都反复不停的计算随机数的平方根

查看容器运行状态（动态更新）

docker stats

因为我虚拟机是四核所以一共有400%，c2 占用三分之二的cpu，c1 占用三分之一的cpu。

（3）设置容器绑定指定的CPU

先分配给虚拟机4个CPU核数

docker run -itd --name c3 --cpuset-cpus 1,3 centos:7 /bin/bash

c3容器绑定cpu1和cpu3.

#进入容器，进行压力测试

yum install -y epel-release
yum install stress -y
stress -c 4

打开另一个终端执行 top 命令再按 1 查看CPU使用情况。

可以看到cpu只有cpu1和cpu3在进行压测，因为c3容器只能使用这两个cpu

2．对内存使用的限制

-m (--memory=) 选项用于限制容器可以使用的最大内存

docker run -itd --name c4 -m 512m centos:7 /bin/bash

限制c4容器最多使用512mb的内存。

查看容器运行状态

docker stats

限制可用的 swap 大小， --memory-swap

注意，--memory-swap 是必须要与 --memory 一起使用。

正常情况下，--memory-swap 的值包含容器可用内存和可用 swap。

所以 -m 300m --memory-swap=1g 的含义为：容器可以使用 300M 的物理内存，并且可以使用 700M（1G - 300）的 swap。

如果 --memory-swap 设置为 0 或者不设置，则容器可以使用的 swap 大小为 -m 值的两倍。
如果 --memory-swap 的值和 -m 值相同，则容器不能使用 swap。
如果 --memory-swap 值为 -1，它表示容器程序使用的内存受限，而可以使用的 swap 空间使用不受限制（宿主机有多少 swap 容器就可以使用多少）。

docker run -itd --name c9 -m 512m --memory-swap=2g centos:7 /bin/bash

一般我们不会使用swap分区且会关闭swap分区。

3．对磁盘IO配额控制（blkio）的限制

注意！！docker的 26版本不支持此设置，正常情况下生产环境使用的是20版本（20.10），20版本支持对容器进行IO的配额控制。

可以去下载20.10.18版本的docker。

--device-read-bps：限制某个设备上的读速度bps（数据量），单位可以是kb、mb(M)或者gb。
例：docker run -itd --name c5 --device-read-bps /dev/sda:1M centos:7 /bin/bash

--device-write-bps ： 限制某个设备上的写速度bps（数据量），单位可以是kb、mb(M)或者gb。
例：docker run -itd --name c6 --device-write-bps /dev/sda:1mb centos:7 /bin/bash

--device-read-iops ：限制读某个设备的iops（次数）

--device-write-iops ：限制写入某个设备的iops（次数）

实验实例：

创建容器，并限制写速度
docker run -itd --name c6 --device-write-bps /dev/sda:1mb centos:7 /bin/bash


进入容器，通过dd来验证写速度
dd if=/dev/zero of=test.out bs=1M count=10 oflag=direct
#添加oflag参数以规避掉文件系统

清理docker占用的磁盘空间

docker system prune -a

#可以用于清理磁盘，删除关闭的容器、无用的数据卷和网络

删除所有未使用的容器：不仅是已停止的容器，还包括没有运行也没有被其他容器依赖的容器。
删除未使用的镜像：这包括悬挂的镜像（没有标签的镜像）以及未被任何容器引用的镜像，即使它们之前被标记过。当使用 -a 选项时，即使是那些没有被标记为latest或者其他特定标签，但也没有容器依赖的镜像也会被删除。
删除未使用的网络：自定义的网络，如果没有容器连接到它们，将会被删除。
删除未使用的卷（如果使用 --volumes 或 -v 选项）：默认情况下，此选项不启用，但加上 -a 时通常会包含删除未被任何容器挂载的卷。

此命令非常有用，尤其是在开发过程中或定期维护时，帮助回收磁盘空间并保持Docker环境的整洁。然而，由于其强大的清理能力，使用前应确保理解其后果，避免误删重要数据。在执行此命令之前，如果有任何数据需要保留，最好先做好备份。

扩展案例：

由于docker容器故障导致大量日志集满，会造成磁盘空间满

1、清除日志

#!/bin/bash
logs=$ (find /var/lib/docker/containers/ -name *-json.log*)
for log in $logs
do
cat /dev/null > $log
done

2、当日志占满之后如何处理

###设置docker日志文件数量及每个日志大小
 vim /etc/docker/daemon.json
{
"registry-mirrors": ["http://f613ce8f.m.daocloud.io"]，
"log-driver": "json-file",   #我的一日志格式
"log-opts": { "max-size" : "500m", "max-file" : "3"}   日志的参数最大500M   我最大容器中有三个日志文件 每个日志文件大小是500M
}

修改完需要重新加载  systemctl daemon-reload


max-size: 这个选项指定了单个日志文件的最大大小。在这个例子中，"500m" 表示每个日志文件的最大容量是
500兆字节(MB)。当日志文件达到这个大小限制后，Docker会采取相应的滚动策略。

max-file: 此选项限定了保留的日志文件的最大数量。在这里，"3" 表示Docker将为每个容器保留最多3个日志
文件。当达到文件数量限制并且日志继续产生时，最旧的日志文件会被自动删除以腾出空间给新的日志文件。

使用此设置的Docker容器，其日志将会被分割存储到最多3个文件中，每个文件最大不超过500MB。这样可以有效
控制日志占用的磁盘空间，避免因日志无限增长而导致的磁盘空间不足问题。

我们进入到/var/lib/docker/containers/目录如何查看该目录下各个文件的大小？

du -sh *

如何将容器内的时区改成上海？

进入容器后输入

ln -sf /usr/share/zoneinfo/Asia/Shanghai /etc/localtime

Docker 网络与资源控制

一、docker 网络