目录
一、docker 网络
Docker 网络实现原理
Docker使用Linux桥接,在宿主机虚拟一个Docker容器网桥(docker0),Docker启动一个容器时会根据Docker网桥的网段分配给容器一个IP地址,称为Container-IP,同时Docker网桥是每个容器的默认网关。因为在同一宿主机内的容器都接入同一个网桥,这样容器之间就能够通过容器的 Container-IP 直接通信。
Docker网桥是宿主机虚拟出来的,并不是真实存在的网络设备,外部网络是无法寻址到的,这也意味着外部网络无法直接通过 Container-IP 访问到容器。如果容器希望外部访问能够访问到,可以通过映射容器端口到宿主主机(端口映射),即 docker run 创建容器时候通过 -p 或 -P 参数来启用,访问容器的时候就通过[宿主机IP]:[容器端口]访问容器。
端口映射
docker run -d --name test1 -P nginx
#随机映射端口(从32768开始)
docker run -d --name test2 -p 41000:80 nginx
#指定映射端口
[root@ha01 opt]# docker run -d --name test1 -p 41000:80 nginx
[root@ha01 opt]# docker ps -a
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
140b262d52d1 nginx "/docker-entrypoint.…" 36 minutes ago Up 36 minutes 0.0.0.0:41000->80/tcp, :::41000->80/tcp test1
注意:如果使用的是从修改过的容器中导出的镜像文件会报错。没有会自动下载。
查看容器的输出和日志信息
docker logs 容器的ID/名称
如果容器中nginx或tomcat的服务挂了,日志会不停生成 导致资源被大量占用。甚至所有服务都会挂。
Docker 的网络模式:
●Host:容器将不会虚拟出自己的网卡,配置自己的IP等,而是使用宿主机的IP和端口。
与宿主机共享网络名称空间
●Container:创建的容器不会创建自己的网卡,配置自己的IP,而是和一个指定的容器共享IP、端口范围。
多个容器之间共享一个network namespace(命名空间)
●None:该模式关闭了容器的网络功能。
●Bridge:默认为该模式,此模式会为每一个容器分配、设置IP等,并将容器连接到一个docker0虚拟网桥,通过docker0网桥以及iptables nat 表配置与宿主机通信。
默认模式 通过VETH 对接 docker0 网桥 ,网桥分配给容器IP,同时docker0作为局域网内 容器的网关,最后与宿主机网卡进行通讯。
●自定义网络
docker允许用户创建自己的定义的网络,用户可以定义的网络范围、子网、路由 等参数,这种类型网络使用用户可以更好地对容器网络进行控住和隔离
(生产业务需求;注:根据甲方指定或领导指定)
根据业务需求指定静态IP地址
安装Docker时,它会自动创建三个网络,bridge(创建容器默认连接到此网络)、 none 、host
docker network ls 或 docker network list #查看docker网络列表
指定格式
使用docker run创建Docker容器时,可以用 --net 或 --network 选项指定容器的网络模式
●host模式:使用 --net=host 指定。
●none模式:使用 --net=none 指定。
●container模式:使用 --net=container:NAME_or_ID 指定。
●bridge模式:使用 --net=bridge 指定,默认设置,可省略。
网络模式详解:
1.host模式
相当于Vmware中的桥接模式,与宿主机在同一个网络中,但没有独立IP地址。
Docker使用了Linux的Namespaces技术来进行资源隔离,如PID Namespace隔离进程,Mount Namespace隔离文件系统,Network Namespace隔离网络等。
一个Network Namespace提供了一份独立的网络环境,包括网卡、路由、iptable规则等都与其他的Network Namespace隔离。 一个Docker容器一般会分配一个独立的Network Namespace。
但如果启动容器的时候使用host模式,那么这个容器将不会获得一个独立的Network Namespace, 而是和宿主机共用一个Network Namespace。容器将不会虚拟出自己的网卡、配置自己的IP等,而是使用宿主机的IP和端口。
docker run -d --name test2 --net=host nginx:latest
如何查看network是host模式的容器?
docker ps --filter "network=host"
2.container模式
在理解了host模式后,这个模式也就好理解了。这个模式指定新创建的容器和已经存在的一个容器共享一个Network Namespace,而不是和宿主机共享。
新创建的容器不会创建自己的网卡,配置自己的IP,而是和一个指定的容器共享IP、端口范围等。同样,两个容器除了网络方面,其他的如文件系统、进程列表等还是隔离的。两个容器的进程可以通过lo网卡设备通信。
实验实例:
[root@ha01 opt]#docker run -itd --name test3 centos:7 /bin/bash
[root@ha01 opt]#docker ps -a
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
10590fbd71b4 centos:7 "/bin/bash" 2 seconds ago Up 1 second test3
[root@ha01 opt]#docker inspect -f '{{.State.Pid}}' test3 #查看容器进程号
98664
[root@ha01 opt]#ll /proc/98664/ns #查看容器的进程、网络、文件系统等命名空间编号
总用量 0
lrwxrwxrwx. 1 root root 0 4月 24 15:51 ipc -> ipc:[4026532758]
lrwxrwxrwx. 1 root root 0 4月 24 15:51 mnt -> mnt:[4026532756]
lrwxrwxrwx. 1 root root 0 4月 24 15:28 net -> net:[4026532761] # net后面是网络编号
lrwxrwxrwx. 1 root root 0 4月 24 15:51 pid -> pid:[4026532759]
lrwxrwxrwx. 1 root root 0 4月 24 15:51 user -> user:[4026531837]
lrwxrwxrwx. 1 root root 0 4月 24 15:51 uts -> uts:[4026532757]
创建并启动名称 test4 网络模式为container的容器, 指定 共享 test3 的IP地址
docker run -itd --name test4 --net=container:test3 centos:7 /bin/bash
或者是
docker run -itd --name test4 --net=container:10590fbd71b4 centos:7 /bin/bash
[root@ha01 opt]#docker ps -a
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
3ca277cdfdd2 centos:7 "/bin/bash" 4 seconds ago Up 3 seconds test4
10590fbd71b4 centos:7 "/bin/bash" 29 minutes ago Up 29 minutes test3
[root@ha01 opt]#docker inspect -f '{{.State.Pid}}' test4 #查看容器进程号
104977
[root@ha01 opt]#ll /proc/104977/ns #查看可以发现两个容器的 net namespace 编号相同
总用量 0
lrwxrwxrwx. 1 root root 0 4月 24 16:06 ipc -> ipc:[4026532858]
lrwxrwxrwx. 1 root root 0 4月 24 16:06 mnt -> mnt:[4026532856]
lrwxrwxrwx. 1 root root 0 4月 24 16:06 net -> net:[4026532761] #与test3的编号相同
lrwxrwxrwx. 1 root root 0 4月 24 16:06 pid -> pid:[4026532859]
lrwxrwxrwx. 1 root root 0 4月 24 16:06 user -> user:[4026531837]
lrwxrwxrwx. 1 root root 0 4月 24 16:06 uts -> uts:[4026532857]
注意:test3有8080端口的服务,test4就不能有这个服务,不然端口会发生冲突。因为它们使用的都是同一个IP不能出现相同的端口。
3.none模式
使用none模式,Docker容器拥有自己的Network Namespace,但是,并不为Docker容器进行任何网络配置。 也就是说,这个Docker容器没有网卡、IP、路由等信息。这种网络模式下容器只有lo回环网络,没有其他网卡。这种类型的网络没有办法联网,封闭的网络能很好的保证容器的安全性。
无实际用处,生产环境基本不会使用。
docker run -itd --name test6 --net=none nginx:latest /bin/bash
4.bridge模式
bridge模式是docker的默认网络模式,不用--net参数,就是bridge模式。
docker run -itd --name test01 nginx:latest /bin/bash
相当于Vmware中的 nat 模式,容器使用独立network Namespace,并连接到docker0虚拟网卡。通过docker0网桥以及iptables nat表配置与宿主机通信,此模式会为每一个容器分配Network Namespace、设置IP等,并将一个主机上的 Docker 容器连接到一个虚拟网桥上。
(1)当Docker进程启动时,会在主机上创建一个名为docker0的虚拟网桥,此主机上启动的Docker容器会连接到这个虚拟网桥上。虚拟网桥的工作方式和物理交换机类似,这样主机上的所有容器就通过交换机连在了一个二层网络中。
(2)从docker0子网中分配一个IP给容器使用,并设置docker0的IP地址为容器的默认网关。在主机上创建一对虚拟网卡veth pair设备。veth设备总是成对出现的,它们组成了一个数据的通道,数据从一个设备进入,就会从另一个设备出来。因此,veth设备常用来连接两个网络设备。
(3)Docker将 veth pair 设备的一端放在新创建的容器中,并命名为 eth0(容器的网卡),另一端放在主机中, 以 * 这样类似的名字命名,并将这个网络设备加入到 docker0 网桥中。可以通过 brctl show 命令查看。
(4)使用 docker run -p 时,docker实际是在iptables做了DNAT规则,实现端口转发功能。可以使用iptables -t nat -vnL 查看。
[root@ha01 ~]#docker ps -a
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
6285eb4b34e4 nginx "/docker-entrypoint.…" 3 hours ago Up 3 hours 0.0.0.0:41000->80/tcp, :::41000->80/tcp test1
5.自定义网络
直接使用bridge模式,是无法支持指定IP运行docker的,例如执行以下命令就会报错
docker run -itd --name test7 --network bridge --ip 172.17.0.10 centos:7 /bin/bash
创建自定义网络
#可以先自定义网络,再使用指定IP运行docker
docker network create --subnet=172.18.0.0/16 --opt "com.docker.network.bridge.name"="docker1" mynet
docker1 为执行 ifconfig -a 命令时,显示的网卡名,如果不使用 --opt 参数指定此名称,那你在使用 ifconfig -a 命令查看网络信息时,看到的是类似 br-110eb56a0b22 这样的名字,这显然不怎么好记。
mynet 为执行 docker network list 命令时,显示的bridge网络模式名称。
指定IP地址:
docker run -itd --name test8 --net mynet --ip 172.18.0.11 centos:7 /bin/bash
docker网络总结:
docker网络模式
① host 容器使用宿主机的网络直接公开服务。
这意味着你在容器中运行一个web服务,那么它就直接绑定到主机的网络接口上,
而不是通过docker进行任何网络转发
简短:与宿主机共享网络名称空间
docker run -d --name test2 --net=host nginx:latest
② container
这种模式允许容器去共享另一个容器网络命名空间,这说明两个容器可以使用相同的网络接口和IP地址,
他们共享的是同一网络命名空间。但不能出现相同的端口
简短:多个容器之间共享一个network namespace(命名空间)
docker run -itd --name test4 --net=container:test3 centos:7 /bin/bash
docker inspect -f '{{.State.Pid}}' 容器名称/id #查看容器进程号
ll /proc/进程号/ns #查看容器的进程、网络、文件系统等命名空间编号
③ none
是最简单的网络模式,此网络模式 将容器拥有自己的网络命名空间,但不会进行任何网络配置,
这实际给了用户完全的自主权来给自己配置容器的网络
简短:自闭空间
docker run -itd --name test6 --net=none nginx:latest /bin/bash
④ bridge 默认的网络模式
每个新创建的容器都将该网络分配一个P地址,此网络模式允许所有docker容器之间以及docker宿
主机之间进行互相通信
默认模式 通过VETH 对接 docker0 网桥 ,网桥分配给容器IP,同时docker0作为局域网内
容器的网关,最后与宿主机网卡进行通讯。
docker run -itd --name test01 nginx:latest /bin/bash
⑤ user-defined network 自定义
docker允许用户创建自己的定义的网络,用户可以定义的网络范围、子网、路由 等参数,
这种类型网络使用用户可以更好地对容器网络进行控住和隔离
(生产业务需求;注:根据甲方指定或领导指定)
根据业务需求指定静态IP地址
docker network create --subnet=172.18.0.0/16 --opt "com.docker.network.bridge.name"="docker1" mynet
docker run -itd --name test8 --net mynet --ip 172.18.0.11 centos:7 /bin/bash 指定IP地址
二、资源控制
1.CPU 资源控制
cgroups,是一个非常强大的linux内核工具,他不仅可以限制被 namespace 隔离起来的资源, 还可以为资源设置权重、计算使用量、操控进程启停等等。 所以 cgroups(Control groups)实现了对资源的配额和度量。
资源限制就是为了防止容器占用资源过大导致所有服务崩溃。
cgroups有四大功能:
●资源限制:可以对任务使用的资源总额进行限制
●优先级分配:通过分配的cpu时间片数量以及磁盘IO带宽大小,实际上相当于控制了任务运行优先级
●资源统计:可以统计系统的资源使用量,如cpu时长,内存用量等
●任务控制:cgroup可以对任务执行挂起、恢复等操作
(1)设置CPU使用率上限
Linux通过CFS(Completely Fair Scheduler,完全公平调度器)来调度各个进程对CPU的使用。CFS默认的调度周期是100ms。
我们可以设置每个容器进程的调度周期,以及在这个周期内各个容器最多能使用多少 CPU 时间。
使用 --cpu-period 即可设置调度周期,使用 --cpu-quota 即可设置在每个周期内容器能使用的CPU时间。两者可以配合使用。
CFS 周期的有效范围是 1ms~1s,对应的 --cpu-period 的数值范围是 1000~1000000。 周期100毫秒
而容器的 CPU 配额必须不小于 1ms,即 --cpu-quota 的值必须 >= 1000。
docker run -itd --name ce1 centos:7 /bin/bash
[root@ha01 ~]#docker ps -a
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
b8d87af5fd37 centos:7 "/bin/bash" 9 seconds ago Up 8 seconds ce1
[root@ha01 ~]#cd /sys/fs/cgroup/cpu/docker/b8d87af5fd370d9a1f74de3aaf06de3f7e6cf85781bc12830c69d2f10c56bd7d/
cat cpu.cfs_quota_us
-1
#cpu.cfs_quota_us:表示该cgroups限制占用的时间(微秒),默认为-1,表示不限制。 如果设为50000,
表示占用50000/100000=50%的CPU。
cat cpu.cfs_period_us
100000
#cpu.cfs_period_us:cpu分配的周期(微秒,所以文件名中用 us 表示),默认为100000微秒。
压力测试:
docker exec -it ce1 /bin/bash 进入ce1 容器
yum install -y vim
vim /cpu.sh
#!/bin/bash
i=0
while true
do
let i++
done
chmod +x /cpu.sh
./cpu.sh
切到另一个终端 真实主机 界面上 使用 top 查看cpu使用情况。
可以看到默认情况下容器使用cpu上限是100%,我们给容器设置50%的比例分配CPU使用时间上限
docker run -itd --name test6 --cpu-quota 50000 centos:7 /bin/bash
#可以重新创建一个容器并设置限额
或者
cd /sys/fs/cgroup/cpu/docker/b8d87af5fd370d9a1f74de3aaf06de3f7e6cf85781bc12830c69d2f10c56bd7d/
echo 50000 > cpu.cfs_quota_us
操作完成后 进入容器内运行脚本,并到真实主机使用top查看cpu使用情况
(2)设置CPU资源占用比
(设置多个容器时才有效)
Docker 通过 --cpu-shares 指定 CPU 份额,默认值为1024,值为1024的倍数。
创建两个容器为 c1 和 c2,若只有这两个容器,设置容器的权重,使得c1和c2的CPU资源占比为1/3和2/3。
docker run -itd --name c1 --cpu-shares 512 centos:7
docker run -itd --name c2 --cpu-shares 1024 centos:7
#分别进入容器,进行压力测试
yum install -y epel-release
yum install -y stress
stress -c 4 #产生四个进程,每个进程都反复不停的计算随机数的平方根
查看容器运行状态(动态更新)
docker stats
因为我虚拟机是四核所以一共有400%,c2 占用三分之二的cpu,c1 占用三分之一的cpu。
(3)设置容器绑定指定的CPU
先分配给虚拟机4个CPU核数
docker run -itd --name c3 --cpuset-cpus 1,3 centos:7 /bin/bash
c3容器绑定cpu1和cpu3.
#进入容器,进行压力测试
yum install -y epel-release
yum install stress -y
stress -c 4
打开另一个终端执行 top 命令再按 1 查看CPU使用情况。
可以看到cpu只有cpu1和cpu3在进行压测,因为c3容器只能使用这两个cpu
2.对内存使用的限制
-m (--memory=) 选项用于限制容器可以使用的最大内存
docker run -itd --name c4 -m 512m centos:7 /bin/bash
限制c4容器最多使用512mb的内存。
查看容器运行状态
docker stats
限制可用的 swap 大小, --memory-swap
注意,--memory-swap 是必须要与 --memory 一起使用。
正常情况下,--memory-swap 的值包含容器可用内存和可用 swap。
所以 -m 300m --memory-swap=1g 的含义为:容器可以使用 300M 的物理内存,并且可以使用 700M(1G - 300)的 swap。
- 如果 --memory-swap 设置为 0 或者 不设置,则容器可以使用的 swap 大小为 -m 值的两倍。
- 如果 --memory-swap 的值和 -m 值相同,则容器不能使用 swap。
- 如果 --memory-swap 值为 -1,它表示容器程序使用的内存受限,而可以使用的 swap 空间使用不受限制(宿主机有多少 swap 容器就可以使用多少)。
docker run -itd --name c9 -m 512m --memory-swap=2g centos:7 /bin/bash
一般我们不会使用swap分区且会关闭swap分区。
3.对磁盘IO配额控制(blkio)的限制
注意!!docker的 26版本不支持此设置,正常情况下生产环境使用的是20版本(20.10),20版本支持对容器进行IO的配额控制。
可以去下载20.10.18版本的docker。
--device-read-bps:限制某个设备上的读速度bps(数据量),单位可以是kb、mb(M)或者gb。
例:docker run -itd --name c5 --device-read-bps /dev/sda:1M centos:7 /bin/bash
--device-write-bps : 限制某个设备上的写速度bps(数据量),单位可以是kb、mb(M)或者gb。
例:docker run -itd --name c6 --device-write-bps /dev/sda:1mb centos:7 /bin/bash
--device-read-iops :限制读某个设备的iops(次数)
--device-write-iops :限制写入某个设备的iops(次数)
实验实例:
创建容器,并限制写速度
docker run -itd --name c6 --device-write-bps /dev/sda:1mb centos:7 /bin/bash
进入容器,通过dd来验证写速度
dd if=/dev/zero of=test.out bs=1M count=10 oflag=direct
#添加oflag参数以规避掉文件系统
清理docker占用的磁盘空间
docker system prune -a
#可以用于清理磁盘,删除关闭的容器、无用的数据卷和网络
- 删除所有未使用的容器:不仅是已停止的容器,还包括没有运行也没有被其他容器依赖的容器。
- 删除未使用的镜像:这包括悬挂的镜像(没有标签的镜像)以及未被任何容器引用的镜像,即使它们之前被标记过。当使用
-a
选项时,即使是那些没有被标记为latest或者其他特定标签,但也没有容器依赖的镜像也会被删除。 - 删除未使用的网络:自定义的网络,如果没有容器连接到它们,将会被删除。
- 删除未使用的卷(如果使用
--volumes
或-v
选项):默认情况下,此选项不启用,但加上-a
时通常会包含删除未被任何容器挂载的卷。
此命令非常有用,尤其是在开发过程中或定期维护时,帮助回收磁盘空间并保持Docker环境的整洁。然而,由于其强大的清理能力,使用前应确保理解其后果,避免误删重要数据。在执行此命令之前,如果有任何数据需要保留,最好先做好备份。
扩展案例:
由于docker容器故障导致大量日志集满,会造成磁盘空间满
1、清除日志
#!/bin/bash
logs=$ (find /var/lib/docker/containers/ -name *-json.log*)
for log in $logs
do
cat /dev/null > $log
done
2、当日志占满之后如何处理
###设置docker日志文件数量及每个日志大小
vim /etc/docker/daemon.json
{
"registry-mirrors": ["http://f613ce8f.m.daocloud.io"],
"log-driver": "json-file", #我的一日志格式
"log-opts": { "max-size" : "500m", "max-file" : "3"} 日志的参数最大500M 我最大容器中有三个日志文件 每个日志文件大小是500M
}
修改完需要重新加载 systemctl daemon-reload
max-size: 这个选项指定了单个日志文件的最大大小。在这个例子中,"500m" 表示每个日志文件的最大容量是
500兆字节(MB)。当日志文件达到这个大小限制后,Docker会采取相应的滚动策略。
max-file: 此选项限定了保留的日志文件的最大数量。在这里,"3" 表示Docker将为每个容器保留最多3个日志
文件。当达到文件数量限制并且日志继续产生时,最旧的日志文件会被自动删除以腾出空间给新的日志文件。
使用此设置的Docker容器,其日志将会被分割存储到最多3个文件中,每个文件最大不超过500MB。这样可以有效
控制日志占用的磁盘空间,避免因日志无限增长而导致的磁盘空间不足问题。
我们进入到/var/lib/docker/containers/目录如何查看该目录下各个文件的大小?
du -sh *
如何将容器内的时区改成上海?
进入容器后输入
ln -sf /usr/share/zoneinfo/Asia/Shanghai /etc/localtime