如何高效维持网络长连接:手把手教你实现 自适应的心跳保活机制

发布于:2024-04-07 ⋅ 阅读:(185) ⋅ 点赞:(0)

解决方案1:进程保活

整体概括如下:

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传 示意图

解决方案2:心跳保活机制

这是本文的重点,下节开始会详细解析

解决方案3:断线重连机制

  • 原理
    检测网络状态变化 & 判断连接的有效性
  • 具体实现
    前者请参考文章:Android:检测网络状态&监听网络变化;后者主要存在于心跳保活机制,所以下面会在心跳保活机制中一起讲解。

4. 心跳保活机制简介

  • 心跳保活机制的整体介绍如下

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传 示意图

  • 注:很多人容易混淆 心跳机制 & 轮询机制,此处给出二者区别

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传 示意图


5. 主流心跳机制分析 & 对比

对国、内外主流的移动IM产品(WhatsAppLine、微信)进行了心跳机制的简单分析 & 对比,具体请看下图

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传示意图


6. 心跳机制方案 总体设计

下面,将根据市面上主流的心跳机制,设计 一套心跳机制方案

6.1 基本流程

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传 示意图

6.2 设计要点

  • 对于心跳机制方案设计的主要考虑因素 = 保证消息的实时性 & 耗费设备的资源(网络流量、电量、CPU等等)
  • 从上图可以看出,对于心跳机制方案设计的要点在于
  1. 心跳包的规格(内容 & 大小)
  2. 心跳发送的间隔时间
  3. 断线重连机制 (核心 = 如何 判断长连接的有效性)

在下面的方案设计中,将针对这3个问题给出详细的解决方案。


7. 心跳机制方案 详细设计

7.1 心跳包的规格

为了减少流量 & 提高发送效率,需要精简心跳包的设计

7.1.1 设计原则

主要从心跳包的内容 & 大小入手,设计原则具体如下

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传 示意图

7.1.2 设计方案

心跳包 = 1个携带少量信息 & 大小在10字节内的信息包


7.2 心跳发送的间隔时间

为了 防止NAT超时 & 减少设备资源的消耗(网络流量、电量、CPU等等),心跳发送的间隔时间 是 整个 心跳机制方案设计的重点。

7.2.1 设计原则

心跳发送间隔时间的设计原则如下

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传 示意图

7.2.2 设计方案
a. 最直接 & 常用方案
  • 一般,最直接 & 常用的心跳发送间隔时间设置方案 :每隔估计 x 分钟发送心跳包1次

  • 即 选择 <所有NAT超时时间最短(5分钟)的时间 即可,综合主流移动IM产品,此处建议 x= 4分钟

  • 但是,这种方案存在一些问题:

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传 示意图

下面,我将详细讲解 自适应心跳间隔时间 的设计方案

b. 自适应心跳间隔时间 设计方案
  • 基本流程

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传 示意图

  • 该方案需要解决的有2个核心问题:

1.如何自适应计算心跳间隔 从而使得心跳间隔 接近 当前NAT 超时时间?

答:不断增加心跳间隔时间进行心跳应答测试,直到心跳失败5次后,即可找出最接近 当前NAT 超时时间的心跳间隔时间。具体请看下图:

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传 示意图

注:只有当心跳间隔 接近 NAT 超时时间 时,才能最大化平衡 长连接不中断 & 设备资源消耗最低的问题

2.如何检测 当前网络环境的NAT 超时时间 发生了变化 ?

答:当前发送心跳包成功 的最大间隔时间(即最接近NAT超时时间的心跳间隔) 发送失败5次后,则判断当前网络环境的NAT 超时时间 发生了变化。具体请看下图:

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传 示意图

注:在检测到 NAT 超时时间 发生变化后,重新自适应计算心跳间隔 从而使得心跳间隔 接近 NAT 超时时间

  • 总结:统筹2个核心问题,总结出自适应心跳间隔时间 设计方案为下图

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传 示意图


7.3 断线重连机制

该机制的核心在于, 如何 判断长连接的有效性

即,什么情况下视为 长连接 断线?

7.3.1 设计原则
  • 判断长连接是否有效的准则 = 服务器是否返回心跳应答
  • 此处需要 分清:长连接 存活 & 有效 状态的区别:

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传 示意图

7.3.2 设计方案
  • 基本思路
    若连续5次发送心跳后,服务器都无心跳应答,则视为长连接无效

通过计数计算

  • 判断流程

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传 示意图

7.3.3 网上流传的方案

在网上流传着一些用于判断长连接是否有效的方案,具体介绍如下

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传 示意图

至此,关于心跳保活机制已经讲解完毕。

7.4 总结

  • 设计方案

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传 示意图

  • 流程设计

其中,标识 “灰色” 的判断流程参考上文描述

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传 示意图


8. 优化 & 完善

  • 上面的方案依然会存在缺陷,从而导致 长连接断开

如,长连接本身不可用(此时重连多少次也没用)

  • 下面,将优化 & 完善上述方案,从而保证 客户端与服务器依然保持着通信状态

  • 优化点

  1. 确保当前网络的有效性 & 稳定性再开始长连接
  2. 自适应计算心跳包间隔时间的时机

8.1 确保当前网络的有效性 & 稳定性再开始长连接

  • 问题描述

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传 示意图

  • 解决方案

自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。

深知大多数Android工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年Android移动开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
img
img
img
img
img
img
img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Android开发知识点,真正体系化!

由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新

如果你觉得这些内容对你有帮助,可以添加V获取:vip204888 (备注Android)
img

更多Android高级工程师进阶学习资料

进阶学习视频

附上:我们之前因为秋招收集的二十套一二线互联网公司Android面试真题(含BAT、小米、华为、美团、滴滴)和我自己整理Android复习笔记(包含Android基础知识点、Android扩展知识点、Android源码解析、设计模式汇总、Gradle知识点、常见算法题汇总。)

里面包含不同方向的自学编程路线、面试题集合/面经、及系列技术文章等,资源持续更新中…

附上:我们之前因为秋招收集的二十套一二线互联网公司Android面试真题(含BAT、小米、华为、美团、滴滴)和我自己整理Android复习笔记(包含Android基础知识点、Android扩展知识点、Android源码解析、设计模式汇总、Gradle知识点、常见算法题汇总。)

[外链图片转存中…(img-e2lopYrS-1711861949977)]

里面包含不同方向的自学编程路线、面试题集合/面经、及系列技术文章等,资源持续更新中…

本文已被CODING开源项目:《Android学习笔记总结+移动架构视频+大厂面试真题+项目实战源码》收录