我们接着讲解第三部分:高可用和容灾(15%),这部分是 AWS 认证考试中的重点之一,主要考察如何保证系统持续运行以及在灾难中快速恢复。
核心概念 1:高可用(Availability)
1. 高可用的定义和目标
定义:
高可用指的是系统能尽量保持在线,即使出现硬件故障或部分区域网络中断,也能继续运行。目标:
避免“单点故障”(Single Point of Failure, SPOF),保证服务始终可用。
比喻:
高可用就像餐馆的备用厨师:如果主厨请假,备用厨师能顶上,不耽误顾客用餐。
2. 高可用的实现方式
跨多个可用区部署(Multi-AZ Deployment)
- **什么是可用区(AZ):**AWS 数据中心的物理隔离区域。
不同可用区之间有冗余和独立的电力、网络、冷却系统。 - **跨 AZ 部署:**应用和数据在多个可用区同时存在,即使一个可用区宕机,另一个可用区还能继续提供服务。
比喻:
把重要的数据存在多个保险箱,不怕某个保险箱损坏。考试重点:
- RDS 和 ELB 的 Multi-AZ 配置,确保数据库和流量分发的高可用性。
- **什么是可用区(AZ):**AWS 数据中心的物理隔离区域。
负载均衡(Elastic Load Balancer, ELB)
- **作用:**在多个服务器之间分配用户请求,避免某台服务器负载过高而宕机。
- **特点:**ELB 自动检测健康的服务器,把流量分配到状态良好的服务器上。
比喻:
像饭店的排号系统,分流顾客到空闲的餐桌,避免某一桌“爆满”。考试重点:
- ELB 的健康检查(Health Check)功能:判断服务器是否正常工作。
- 配置 HTTPS 终端节点:确保用户请求通过加密通道。
3. 高可用的生活化例子
场景:在线商店的支付系统
- 使用 RDS 数据库的 Multi-AZ 配置,确保即使一个数据中心宕机,支付数据也不会丢失。
- 在多个服务器上部署支付应用,并通过 ELB 分发请求,防止某个服务器过载。
- 定期测试 ELB 的健康检查,确保故障服务器不会收到用户请求。
考试可能会要求你根据类似场景,选择正确的高可用配置。
核心概念 2:容灾(Disaster Recovery)
1. 容灾的定义和目标
定义:
容灾是指在灾难(如数据中心断电、地震)发生后,尽快恢复服务并减少数据丢失。目标:
提供备份和恢复机制,尽量缩短服务中断时间(RTO)和减少数据丢失量(RPO)。
比喻:
容灾就像备份钥匙和数据:主钥匙丢了,可以用备用钥匙打开保险箱。
2. 容灾的实现方式
备份和恢复(Backup and Restore)
- **备份:**定期把重要数据存储到安全的地方(如 S3)。
- **恢复:**灾难发生后,从备份中还原数据。
考试重点:
- 使用 S3 存储数据库快照(Snapshot)。
- 了解 RDS 的自动备份功能和手动快照。
比喻:
像备份重要文件到云端,即使本地电脑坏了,文件仍能找回。冷备份 vs. 热备份
- **冷备份(Cold Backup):**数据备份在远程存储中,恢复需要较长时间,但成本低。
- **热备份(Hot Backup):**实时同步数据,能快速切换到备用系统,但成本较高。
比喻:
冷备份像离线的档案室,拿出来需要时间;热备份像实时的备用电源,立即可用。跨区域复制(Cross-Region Replication)
- **作用:**在不同地理区域间复制数据,确保即使整个区域故障,数据仍然安全。
- **支持服务:**S3 和 DynamoDB 提供跨区域复制功能。
比喻:
把重要资料复印一份存在异地的保险柜里,防止本地灾难导致数据全丢。
3. 容灾的策略
备份频率:
- 关键数据(如客户信息、交易记录)需要每天备份。
- 非关键数据可按周或月备份。
测试恢复:
- 定期演练灾难恢复,确保备份的数据能正确还原。
选择适合的恢复时间目标(RTO)和恢复点目标(RPO):
- **RTO(恢复时间目标):**多快能恢复服务。
- **RPO(恢复点目标):**多少数据可以接受丢失。
考试重点:
- RDS 提供自动备份,能实现较短的 RTO 和 RPO。
- S3 的版本控制(Versioning)功能有助于避免意外数据丢失。
4. 容灾的生活化例子
场景:银行的数据保护
- 每晚把当天的交易记录备份到 S3(冷备份)。
- 使用 RDS 的 Multi-AZ 配置进行实时同步(热备份)。
- 关键数据在不同区域间复制,避免区域性灾难导致数据丢失。
小结:高可用和容灾的考试技巧
高可用:
- 熟悉 Multi-AZ 和 ELB 的配置和工作原理。
- 知道如何避免单点故障,比如通过负载均衡分流。
容灾:
- 掌握 RDS 和 S3 的备份与恢复功能。
- 知道冷备份与热备份的区别及适用场景。
- 熟悉跨区域复制的配置和优势。