Energy期刊论文学习——基于集成学习模型的多源域迁移学习方法用于小样本实车数据锂离子电池SOC估计

发布于:2025-09-05 ⋅ 阅读:(22) ⋅ 点赞:(0)

Hi,大家好,我是半亩花海。现对领域内一篇SCI一区TOP期刊论文进行阅读,文献记录如下。本文提出一种基于集成学习的多源域迁移学习方法,用于解决小样本实车数据下锂电池SOC估计难题。研究构建包含锂三元、磷酸铁锂电池和实车数据的多源域集,针对不同源域设计差异化预训练模型(BiLSTM适配实验室数据,CNN-LSTM适配实车数据),并创新性地采用LSBoost动态权重融合策略。实验表明,该方法在目标域SOC估计中取得显著效果(MAE=0.187%,RMSE=0.245%),有效克服了传统单源迁移的负迁移问题


目录

一、研究背景与意义

二、模型方法

2.1 基础模型原理

2.2 多源域迁移学习框架

2.3 差异化预训练模型(图 6)

三、实验结果与分析

3.1 实验数据集

3.2 预训练模型对比实验

3.3 特征可视化验证

3.4 迁移学习实验

3.5 鲁棒性与泛化性验证

四、结论


一、研究背景与意义

  1. SOC(State of Charge)估计是电池管理系统(BMS)中的核心任务,直接影响电动汽车的安全性与可靠性。
  2. 实际车辆运行数据往往存在小样本、不完整充放电过程、噪声多、分布差异大等问题,导致传统数据驱动方法表现受限。
  3. 单一源域的迁移学习易受源域数据质量影响,可能出现负迁移(negative transfer),泛化能力差。

锂离子电池因高能量密度和长寿命成为电动汽车(EVs)的核心部件,而电池管理系统(BMS)需依赖 SOC 这一关键参数实现电池全生命周期控制。准确的 SOC 估计可避免过充、过放等问题导致的热失控或电池损坏,保障行车安全,同时延长电池寿命并提供可靠的续航信息,对电动汽车的安全稳定运行至关重要。

  • 直接法:包括安时积分法(Ah)和开路电压法(OCV)。OCV 法需长时间静置,不适合实时估计;Ah 法则存在电流测量误差累积等问题,精度随时间下降。
  • 模型法:分为等效电路模型(ECM)和电化学模型(EM)。EM 需复杂的物理化学参数,实用性差;ECM 依赖精确建模,电池老化会导致参数变化,在低温或低 SOC 下精度不足。
  • 数据驱动法:基于深度学习等算法,需大量数据训练,且假设数据独立同分布。但实车场景中难以获取完整充放电循环数据(小样本问题),且驾驶行为、工况差异会导致数据分布变化,降低估计精度。

迁移学习(TL)通过借鉴源域知识解决目标域问题,减少对目标域数据的依赖,已被应用于 SOC 估计。但现有方法多基于单源域迁移,其效果受源域数据质量和代表性限制,源域与目标域分布差异过大时易产生 “负迁移”,导致模型性能下降。

针对小样本实车数据下的 SOC 估计难题,本文提出多源域迁移集成学习方法,主要贡献包括:

1)构建涵盖多化学体系(锂三元、磷酸铁锂)和实车数据的源域集,增强迁移的多样性和鲁棒性;

2)为不同源域设计差异化预训练模型(BiLSTM 适配实验室数据,CNN-LSTM 适配实车数据);

3)提出基于集成学习的动态权重融合策略,规避负迁移,提升小样本场景下的估计精度和泛化能力。


二、模型方法

模型

适用场景

特点

BiLSTM

实验室数据

双向时间依赖,全局特征提取

CNN-LSTM

实车数据

局部特征 + 长期记忆,抗噪声强

LSBoost

多源融合

动态权重,集成决策,提升鲁棒性

2.1 基础模型原理

(1)LSTM(长短期记忆网络):作为改进的循环神经网络,通过遗忘门、输入门和输出门结构(图 1)捕捉长时序依赖,适用于 SOC 这类随时间动态变化的序列预测任务,公式(1)-(6)描述了各 gate 的计算逻辑。

(2)BiLSTM(双向 LSTM):由正向和反向两个 LSTM 单元组成(图 2),可同时捕捉序列的过去和未来信息,增强对电池 SOC 动态变化的全局时序模式建模能力,尤其适合实验室标准放电数据。

(3)CNN(卷积神经网络):通过 1D 卷积核提取局部特征(图 3),公式(7)展示了卷积运算过程,能有效识别 V、I 序列中的突发扰动(如工况切换峰值),适用于含噪声的实车数据。

(4)迁移学习(TL):通过源域预训练模型向目标域迁移知识(图 4),冻结输入层等权重以保留特征提取能力,仅微调输出层适应新任务,减少目标域数据需求。

(5)LSBoost(最小二乘 Boosting):一种集成学习方法,通过迭代训练弱分类器(决策树)并加权融合,以平方损失函数(公式 8)优化预测,提升模型鲁棒性。

2.2 多源域迁移学习框架

整体流程(图 5):构建多源域数据集→为各源域设计预训练模型→通过 LSBoost 集成模型输出→动态分配权重实现目标域 SOC 估计。

2.3 差异化预训练模型(图 6)

  • 针对实验室数据(源域 1、2):采用 BiLSTM 模型,利用其双向时序建模能力捕捉全局放电趋势。
  • 针对实车数据(源域 3):采用 CNN-LSTM 融合模型,CNN 提取局部扰动特征,LSTM 捕捉长时容量衰减趋势,适配动态工况。
  • 多源融合机制:通过 LSBoost 根据源域与目标域的分布差异及预测残差,动态调整各模型权重,抑制负迁移,融合多源知识提升估计精度。


三、实验结果与分析

3.1 实验数据集

(1)源域数据集:包含 3 类数据:

  • 源域 1:锂三元电池(NCM/NCA)实验室数据,覆盖完整充放电循环,图 7 展示了 cell10 的电压、电流曲线;
  • 源域 2:A123 磷酸铁锂电池实验室数据,包含 DST、FUDS、US06 等工况(图 8);
  • 源域 3:未知型号实车一年运行数据,涵盖城市、高速等场景,图 9 显示其电压、电流及 SOC 曲线

(2)目标域数据集:另一未知型号实车的小样本放电数据(图 10),SOC 范围 0.09-1,样本量有限且数据分布与源域存在差异

3.2 预训练模型对比实验

对 LSTM、BiLSTM、CNN-LSTM、Transformer 在 3 个源域分别训练,通过 RMSE 和 MAE 评估性能:

(1)源域 1 和 2(实验室数据)中,BiLSTM 表现最优(源域 1:RMSE=0.526%,MAE=0.397%;源域 2:RMSE=1.176%,MAE=0.87%),因其双向机制能捕捉全局时序依赖(图 11-12);

(2)源域 3(实车数据)中,CNN-LSTM 最优(RMSE=0.723%,MAE=0.571%),因其结合 CNN 局部特征提取与 LSTM 长时记忆,适配动态扰动(图 13)。

3.3 特征可视化验证

采用 t-SNE 技术可视化模型提取的特征:源域 2(实验室数据)中,BiLSTM 提取的特征呈连续带状分布(图 14a),体现全局时序模式捕捉能力;CNN 特征则分散(图 14b),难以反映全局趋势。

在源域 3(实车数据)中,CNN 提取的特征呈局部聚类(图 14d),适配动态扰动;BiLSTM 特征则聚集混乱(图 14c),对局部变化不敏感。

3.4 迁移学习实验

(1)单源域迁移(图 15):3 个源域预训练模型经微调后在目标域测试,源域 2 的 BiLSTM 表现最佳(RMSE=0.583%,MAE=0.455%),但整体误差高于多源域方法。

(2)多源域迁移(基于 LSBoost 集成)(图 16):融合 3 个源域模型输出,动态分配权重,最终目标域估计误差显著降低(MAE=0.187%,RMSE=0.245%),MAE 曲线更稳定(图 16b)。

3.5 鲁棒性与泛化性验证

(1)不同放电起点实验(图 17):在 80% 和 60% SOC 起点下,多源域方法均优于单源域,验证对非理想场景的适配性。

(2)多目标域测试(图 18,表 5):对 3 个未知型号实车数据(又选了另外三个目标域,检测泛化能力),模型仍保持高精度(如目标域 2:RMSE=0.165%,MAE=0.148%),且权重随目标域特性动态调整(表 5),体现强泛化能力。


四、结论

实车运行过程中存在小样本不完整放电数据,而基于数据驱动的神经网络方法难以通过模型训练学习特征,导致预测精度受限。针对小样本数据和不完整放电条件下荷电状态(SOC)预测精度不足的问题,本文提出一种基于集成学习的多源域迁移学习方法用于 SOC 预测

  • 首先,基于多种化学体系构建了多源域数据集,包括锂三元电池、磷酸铁锂电池和未知型号实车电池数据。这有助于克服传统单源模型在目标域电池类型不确定时的泛化瓶颈,解决了传统单源模型在目标域电池类型未知时的特征泛化难题。
  • 其次,基于电池老化趋势,针对三种不同类型的电池设计了相应的预训练模型选择基于 LSTM、BiLSTM 和 CNN-LSTM 的异质预训练模型集,以减少单一模型在跨电池型号迁移时的局限性。其中,CNN-LSTM 用于捕捉锂三元电池的局部极化模式和时序相关性;BiLSTM 模型通过考虑正向和反向时间序列,能更全面地建模锂三元电池的时序依赖关系。迁移学习降低了对目标域大规模数据的依赖,解决了神经网络训练需要大量样本的问题。通过单源域迁移验证了各预训练模型在目标域的特征迁移能力。
  • 最后,将集成学习策略应用于多源域迁移学习,融合三个源域模型的输出并动态分配模型权重,进一步提高了预测精度。
  • 实验结果显示,多源域迁移学习模型的 SOC 估计性能优于其他方法,平均绝对误差(MAE)为 0.187%,均方根误差(RMSE)为 0.245%。

该方法有效实现了多源域迁移,使具有小样本和未知电池型号的目标域数据能够学习丰富的知识并完成准确的 SOC 预测。实验验证表明,本文提出的基于集成学习的多源域迁移学习方法在 SOC 估计方面具有巨大潜力,尤其在实车电池管理系统(BMS)中具有应用前景。未来的研究将聚焦于两个方向,以增强该方法的鲁棒性和实用性:

  • 一是扩展框架以涵盖更多电池化学体系(如固态电池)和极端工况,提升其在多样化应用环境中的泛化能力;
  • 二是探索与物理信息的融合,例如纳入电化学模型的约束,以增强小样本条件下的特征学习,进一步缩小理论性能与实车 BMS 实际部署之间的差距。

网站公告

今日签到

点亮在社区的每一天
去签到