首页 > 行业资讯 > 《储能科学与技术》推荐|董渊昌 等:基于SVD-SAE-GPR的锂离子电池RUL预测

《储能科学与技术》推荐|董渊昌 等:基于SVD-SAE-GPR的锂离子电池RUL预测

时间:2023-05-31 来源: 浏览:

《储能科学与技术》推荐|董渊昌 等:基于SVD-SAE-GPR的锂离子电池RUL预测

原创 董渊昌 庞晓琼 等 储能科学与技术
储能科学与技术

esst2012

中文核心、科技核心和cscd核心期刊,化学工业出版社和中国化工学会主办,主编黄学杰研究员。投稿及下载官网:http://esst.cip.com.cn/CN/2095-4239/home.shtml;欢迎给公众号投稿

收录于合集
#2023年第4期 29
#研究 233

作者: 董渊昌   1   庞晓琼   1   贾建芳   2 史元浩   2 温杰   2 李笑   1 张鑫   1

单位: 1.  中北大学计算机科学与技术学院;  2.  中北大学电气与控制工程学院

引用: 董渊昌 , 庞晓琼 , 贾建芳 ,. 基于 SVD-SAE-GPR 的锂离子电池 RUL 预测 [J]. 储能科学与技术 , 2023, 12(4): 1257-1267. 

DOI 10.19799/j.cnki.2095-

4239.2022.0767

摘 要   锂离子电池是重要的储能手段之一,对其剩余使用寿命(RUL)进行预测具有非常重要的实际意义。本工作首先针对传统特征提取方法依赖参数设置且对于不同锂离子电池数据集适应性差的缺陷,将电池数据视作矩阵,并引入奇异值分解(SVD)从测量数据和包含更多退化信息的特征提取对象中提取潜在健康因子(HIs)。其次,潜在HIs的冗余和不足会影响RUL的预测,同时考虑到主成分分析(PCA)的缺点,使用Spearman相关分析和堆叠自编码器(SAE)处理HIs得到一个融合HI。在此基础上,利用高斯过程回归(GPR)算法构建了融合HI与容量之间的模型,得到了带有不确定性表达的最终预测结果。最后,通过NASA提供的四个老化电池数据验证了所提预测模型的可行性和有效性。并额外选取MIT电池数据集验证特征提取方法的适应性。实验结果表明,所提出的RUL预测框架具有较好的预测性能,SVD特征提取方法在避免参数设置的前提下具有较好的适应性。本工作提取的HI与经过PCA融合的HI、其他HI相比,预测精度有显著提高。
关键词   锂离子电池;剩余使用寿命(RUL);奇异值分解;堆叠自编码器;高斯过程回归
锂离子电池因其工作电压高、功率密度大、寿命长等优点,已经成为电动汽车、智能电网和储能系统等众多应用领域的主流能源存储器件。然而,随着充放电次数的增加,电池会通过不同的机制退化甚至失效。如果在其达到失效阈值前不及时采取有效措施,可能会导致设备性能退化甚至灾难性事件的发生。因此,研究电池的退化并建立可靠的退化模型以准确预测其剩余使用寿命(remaining useful life,RUL)是非常重要的。
近年来,数据驱动的方法因可以利用历史监测数据直接预测电池的退化趋势而不依赖于复杂的物理模型,在锂离子电池RUL预测领域受到了广泛关注。目前大多研究定义容量或内阻作为健康因子(health indicator,HI)。然而,容量或内阻的检测对实验条件和仪器设备要求较高,难以实现在线采集。因此,提取易于计算且能量化电池退化状态的HI具有重要的实用价值。Khaleghi等设置电压上下边界并指定固定的采样率从部分充电电压曲线中提取HIs并用来估计电池健康状态。此外,短放电时间间隔内的电流变化、固定电压间隔的时间差等也可以作为反映锂离子电池健康状态的特征。虽然这些方法在提取HI方面展现了优异的性能,但需要设定固定的时间或电压等参数,这不仅依赖于人为经验,还有可能使特征提取变得复杂。Liu等分别在NASA和CALCE的电池数据集上设置了不同的参数提取相同HI并进行RUL预测,结果表明不同锂电池特征提取参数需求可能不同。Pang等提取了更敏感的IC曲线的峰值和峰下的区域面积作为HIs,并对NASA提供的锂离子电池数据集进行RUL预测;而Pan等在CALCE提供的电池数据集上提取的IC曲线有两个可识别的峰,此特征提取方法显然不适用于不同的锂离子电池数据集。文献[ 11-13 ]的特征提取方法虽然可以用于提取HI,但由于电池参数或实验环境的差异,可能不适用于其他锂离子电池数据集。如上所述,传统的特征提取方法通常需要设定参数且适应性较差,因此,本工作的第一个动机是寻找一种能减少或避免参数设定,且对于不同的锂离子电池数据集适应性强的特征提取方法。
基于以上的分析,本工作对电池的原始测量数据重新进行分析,尝试从中获取隐藏的特征信息。根据电池数据的特点,同时考虑到特征值是矩阵的重要信息,本工作将电池数据看作矩阵,从矩阵中计算特征值,然后判断该特征值是否可以作为重要信息来表征电池的退化状态。但电池数据不是方阵,无法获得其特征值,而奇异值分解(singular value decomposition,SVD)可以从非方阵中提取奇异值来表示矩阵的重要信息。因此,本文选择SVD从电池数据中计算奇异值作为HIs。同时,考虑到提取的HIs会有一定的冗余性,当作为训练数据时,其维度过高和不足会使模型训练变得复杂且不利于RUL预测的准确性。因此,本工作的第二个动机是消除HIs不相关信息的负面影响和降低数据维数。在数据去噪和降维方面,主成分分析(principal component analysis,PCA)表现出了较好的性能,但它适合于服从高斯分布的数据且只能执行线性变换,缺乏一定的灵活性。堆叠自编码器(stacked autoencoder,SAE)可以自动从无标注数据中提取学习特征,给出比原始数据更好的特征描述。因此,选择SAE用于HIs的在线融合。
此外,模型和数据的不确定性可能导致预测可靠性差,因此,在研究锂离子电池的RUL预测时考虑预测结果的不确定性是非常有必要的。高斯过程回归(gaussian process regression,GPR)能够实现任意线性或者非线性系统动态行为特征的建模预测,并能以概率的形式解释预测结果的不确定性。考虑到锂离子电池的退化过程是一个复杂的、动态的、非线性的电化学过程,GPR方法适合于建立锂离子电池RUL预测模型。
综上所述,本文提出了一种不需要参数设定且对于不同锂离子电池数据集有良好适应性的特征提取策略,从电池数据中提取潜在HIs并进行相关性分析,选择了极强相关性的HIs进行SAE数据降维,并将融合的HI结合GPR进行RUL预测。通过两组实验验证了本文所提方法的优越性,一是通过不同的锂离子电池数据集验证了SVD特征提取方法具有良好的适应性;二是将本文所提的HI、经过PCA融合的HI与其他HI分别训练GPR模型并进行对比,验证了本文所提的HI具有更好的预测性能。

1 特征提取与分析

1.1 实验数据

本工作中选择的电池退化数据集来自NASA PCoE研究中心。该数据集包含在相同实验环境中收集退化状态数据的4个18650型锂离子电池。4个电池的标称容量为2.2 Ah,标称电压为3.7 V。在充电阶段,以1.5 A恒流(CC)模式充电,直到电池电压达到4.2 V,然后继续以恒压(CV)模式充电,直到充电电流降至20 mA。在放电阶段,以2 A的CC进行放电,直到B0005、B0006、B0007和B0018电池的电压分别降至2.7 V、2.5 V、2.2 V和2.5 V。图1为电池实际容量衰减曲线。

图1     4 个电池的容量退化曲线

1.2 基于SVD的特征提取

在本小节中,首先介绍奇异值分解方法,该方法在本工作中用于特征提取。SVD是一种矩阵分解方法,它可以将复杂矩阵表示为更小更简单的子矩阵的乘法,如图2所示。

图2     矩阵的 SVD
假设矩阵 是一个大小为 的矩阵,则定义矩阵 的SVD如式(1)所示:
(1)
矩阵 的秩为 是大小为 的正交矩阵, 的列向量称为左奇异向量。 是一个大小为 的矩阵,除了主对角线外,所有元素都为0,它是一个对角矩阵。 主对角线上的每个元素称为 的奇异值,记为 是一个大小为 的正交矩阵, 的列向量是右奇异向量。将 乘以其转置矩阵 ,得到式(2),同理可得与 相关的式(3)。
(2)
(3)
可以看出, 的特征向量分别组成了SVD中的矩阵 。由于 的特征值均为 ,如式(4)所示。因此,将矩阵 的奇异值记为
(4)
矩阵奇异值的大小与矩阵中隐藏的重要信息密切相关,信息的重要性与奇异值的大小正相关。可以发现,SVD在矩阵分解过程中不涉及参数设置,可以实现简单的计算过程,降低特征提取的复杂性,同时避免了对人为经验的依赖。因此,选择SVD用来提取能表征电池退化状态的HIs。
通常情况下,锂离子电池的电压、电流和温度等参数都是可测的,因此首先从12组测量数据中通过SVD提取各自的奇异值作为12个HIs(详细描述见表1)。同时考虑到特征提取对象包含的退化信息对提取出来的HI量化电池退化状态的能力有重要影响,额外计算了三组特征提取对象,分别为 矩阵。锂离子电池的退化是一个动态非线性过程,降解模式多种多样,如电极材料的机械降解、锂库存损失、活性材料损失等。所有这些退化模式也可以相互影响。 常被用来分析上述相关的退化模式,因此可以作为反应电池退化状态的特征提取对象,从其中分别提取了HI13、HI14和HI15。 的计算公式如下。

表1   四个电池15个潜在HIs与容量的Spearman相关分析

(5)
(6)
(7)
其中 分别为放电的电流、电压、时间和温度。
以从B0005电池的放电电压中提取HI1为例,使用SVD从电池数据中提取HI的过程为:首先,需要将所有放电周期的电压数据看作矩阵并构建成矩阵集 ,其中 为总放电周期。其次,将所有循环周期的电压数据即矩阵 依次进行SVD。由于每次SVD的处理对象均为单个周期,所以根据矩阵SVD原理,所有放电周期都可以得到一个代表其特征信息的奇异值 。最后,从所有放电周期提取出来的奇异值 则可以构成HI1,表示为 。其他特征提取对象的SVD与之同理。

1.3 特征评估与特征选择

特征融合是HI构建的关键一步,为了得到与容量相关性更强的HI,在融合之前需要对提取出来的潜在HIs进行定量评估和特征选择。考虑到本工作使用的数据不符合正态分布,选择Spearman相关系数来衡量HIs的相关性。15个潜在HIs与容量之间的相关性分析表为表1。根据表1中的相关系数绝对值,选择相关性极强(1~0.9)的HIs进行之后的特征融合。B0005、B0006和B0007选择HI1、HI2、HI4、HI5、HI6、HI8、HI11、HI13和HI15这9个HIs进行融合。B0018选择除了HI14之外的14个HIs进行融合。

1.4 基于SAE的特征融合

SAE也叫深度自动编码器,是可以用于降维和特征提取的无监督神经网络。SAE是多个自动编码器(autoencoder,AE)的叠加,它克服了单层编码器不能有效提取复杂特征的缺点。使用SAE对1.3节中选择的相关性极强的HIs进行处理,以降低维数和噪声。SAE的具体结构如图3(a)所示。将两个SAE堆叠成一个栈式自编码器进行二阶参数融合,结构如图3(b)所示。具体的融合过程为:首先让初始参数作为图3(a)SAE结构的输入和输出,进行网络编码与解码,得到输入层到 层的网络参数,训练完后留图3(b)所示的输入层至 层,隐藏层输出为一阶融合结果。将其结果作为图3(a)所示结构的输入与输出,隐藏层节点数设定为1,使融合结果为一个序列。融合过程与一阶相似,去除解码层后的隐藏层输出即为二阶融合HI。

图3     堆栈式 SAE(a)SAE 结构; (b) 栈式自编码结构
图中 分别为网络的输入和输出; 为连接权值。隐藏层节点输出 和输出层节点 分别为
(8)
(9)
其中 表示融合特征的个数; 表示输入输出的节点个数; f ( · )表示节点激励函数; 均为权值。编码阶段主要是将 维输入样本 通过编码激励函数映射成 维的 ,解码阶段是将 重新映射为 维的
为了进一步分析融合HI量化电池退化状态的能力,对融合HI进行了定量与定性分析。定量分析结果在表2给出,同时为了检验结果的显著性,使用p值法进行了显著性检验。从表中可以看出,四个电池融合HI的Spearman相关系数均大于0.99,且p值也远小于0.01,表明融合HI与容量之间显著相关。定性分析的结果在图4中给出。通过分析图4可以得知四个电池融合HI的曲线与原始容量曲线的退化趋势基本一致。结合定量与定性分析结果,可以得出结论,融合HI可以很好地表征电池的退化状态。

表2   四个电池融合的HI与容量的Spearman相关分析

图4     融合 HI 定性分析: (a)B0005; (b)B0006; (c)B0007; (d)B0018

2 方法论

2.1 GPR

GPR模型是一种非参数模型,可通过先验知识实现贝叶斯框架下的状态预测,估计后验分布,输出预测均值和方差,并通过95%(或其他值)的置信区间来表示预测的不确定性。高斯过程记作如下形式:
(10)
其中 为均值函数、 为协方差函数。具体如下所示:
(11)
(12)
协方差函数用于捕获不同输入之间的相似性。超参数通常通过边概率的最大似然估计来优化。根据训练数据和测试数据构造先验分布,利用贝叶斯理论得到预测的后验分布:
(13)
其中 为训练样本的输入和输出, 为测试样本的输入和预测输出, 为预测均值, 为预测方差。
通过95%的置信区间(CI)用于预测结果不确定度的评估:
(14)

2.2 基于SVD-SAE-GPR的建模过程

本节将SVD、SAE和GPR相结合,提出了一种新的SVD-SAE-GPR锂离子电池RUL预测方法。具体流程如图5所示,可分为四个步骤。

图5     基于 SVD-SAE-GPR 的锂离子电池 RUL 预测流程图
步骤1:SVD特征提取。首先对电池的测量数据进行SVD,将各自的奇异值作为12个潜在HIs;其次根据电流,时间,电压和温度等参数,计算 矩阵,并使用SVD从中提取HI13,HI14和HI15。
步骤2:特征选择和特征融合。通过Spearman相关分析从步骤1中的15潜在HIs中选择相关性极强的HIs进行特征融合。通过SAE处理选择的HIs融合成一个HI。
步骤3:GPR预测容量。以这融合特征 作为模型的输入,以电池容量 作为输出,构建基于GPR的容量预测模型, 为总循环周期。训练集记为 ,其中 ,预测起始点对应的循环数记为 。测试集表示为 ,其中 。预测部分以 为输入,得到容量预测值
步骤4:计算RUL预测值。剩余寿命 为电池实际容量下降到阈值时的总充放电循环次数 与电池当前充放电循环次数 之差。计算公式如式(15)。
(15)

2.3 预测性能评价指标

为了评价本文所提方法的预测性能,分别采用均方根误差(root mean square error, )、决定系数( )、绝对误差(absolute error, )三种评价指标。

3 结果与讨论

3.1 锂离子电池RUL预测结果

为了分析该模型的RUL预测性能,设计了不同预测起始点的实验。实验设置:选取前59个周期和前79个周期的数据作为训练集,即预测起点分别为60和80。电池的故障阈值为额定容量的70%~80%。本工作中,电池B0005、B0006和B0018的容量故障阈值为1.38 Ah。由于B0007电池未达到故障阈值,因此未给出故障阈值线。
图6分别给出了四个电池在预测起始点60和80处的预测结果及其不确定性表达。从整体上可以看出,预测曲线与真实的容量退化曲线较为接近,预测结果受预测起始点的影响较小,且四个电池在预测起始点80时的预测曲线比在预测起始点60时更接近真实容量退化曲线。

图6     四个电池在不同预测起点的预测结果及不确定性表达
此外,表3给出了四个电池的不同预测起始点的预测性能评价结果,从表中可以看出,预测起始点为80的预测误差均比预测起始点为60的预测误差小,且四个电池的 均小于0.0301,说明所提模型的预测性能较好;四个电池的 均大于0.93,说明预测曲线与实际曲线的拟合程度较高;随着预测起始点的后移,B0005、B0006和B0018三个电池的 值逐渐减小。在预测起始点为60时,三个电池的 值均小于6,误差值较小;而且随着预测起始点的后退,在起始点为80时, 值逐渐减小,均不超过2。

表3   四个电池在不同预测起始点的预测性能

3.2 SVD对不同电池数据集的适应性

为了验证SVD特征提取方法对不同锂离子电池数据集的适应性,本小节的实验额外选择了麻省理工学院(Massachusetts Institute of Technology,MIT)提供的电池数据集,其中电池参数和实验环境与NASA提供的电池数据集不同。首先详细描述了用于测试的电池数据集。然后,仍然使用SVD提取HIs。最后,利用GPR进行容量预测。
3.2.1 MIT数据集
测试电池是由A123 Systems公司(APR18650M1A)制造的磷酸锂离子(LFP)/石墨电池,放置在30 ℃的强制对流温度室中,在充电阶段以不同倍率的恒流快充组合形成 72种充电模式,放电过程统一采用4 C倍率。电池标称容量1.1 Ah,标称电压3.3 V。选取“2017-06-30”第二批数据中的两组数据Channel 2 (CH2)和Channel 5 (CH5)进行实验。CH2和CH5的原始容量退化轨迹如图7所示。

图7     CH2 CH5 的容量退化曲线
3.2.2 特征提取、选择与融合
对于CH2和CH5,使用相同的SVD分别从测量数据、 中提取各自的奇异值作为HIs。 在数据集中已经给出, 需要计算才能得到。在计算 时,由于同一周期内某些相邻时间点采集的相同电压值会导致 的值无效,因此将重复的电压数据和其相应测量时间对应的温度数据去除。对提取出来的潜在HIs进行Spearman相关分析,分析结果如表4所示。可以看出除了HI8之外,其余7个潜在HIs与容量之间的相关系数绝对值均大于0.9,属于极强相关。因此,根据相关系数选择除HI8之外的7个HIs使用SAE融合成一个HI。为了分析融合HI表征电池退化状态的能力,计算了它的Spearman相关系数和 p 值,具体结果在表5中给出。从表5中可以看出,融合HI与容量之间的Spearman相关系数均大于0.99, p 值接近于0,表明融合HI与容量显著相关。

表4   CH2和CH5容量与潜在HIs的Spearman相关分析

表5   CH2和CH5容量与融合HI的Spearman相关分析

3.2.3 容量预测
预测部分选用GPR进行建模。以融合HI作为训练数据,以容量作为输出数据,构建基于GPR的容量预测模型。根据CH2和CH5的数据大小,分别选择前500和100个周期的数据进行训练。预测结果如图8所示,可以发现预测曲线能够相对准确地接近真实容量退化曲线。预测性能评价结果如表6所示。从表中可以看出,CH2和CH5的 均小于0.008, 均大于0.94,说明本工作模型具有较好的预测性能,预测曲线与实际曲线吻合较好。

图8     CH2 CH5 的容量预测结果及不确定性表达

表6   CH2和CH5的预测性能

综上所述,通过在NASA和MIT提供的电池数据集实验,可以得出SVD可以用于提取HIs,并且在避免人为设置参数的情况下,对不同电池数据集具有良好的适应性。此外,融合的HI具有较强的相关性和较好的预测性能和准确性。

3.3 不同HI的对比试验分析

为了更充分地说明利用SVD方法从测量数据、 中提取潜在HIs,选择极强相关的HIs使用SAE进行特征融合并结合GPR预测模型(命名为M1)的有效性和优越性,设计了比较模型M2和M3。其中模型M2通过PCA融合模型M1中选择的极强相关的HIs。模型M3使用的HI为放电阶段电压从3.8 V降到3.5 V的等压降放电时间。在预测阶段,模型M1、M2和M3均采用GPR,具体模型描述如表7所示。

表7   对比实验中使用的预测模型(M1、M2和M3)

模型M1、M2和M3对B0005、B0006、B0007和B0018电池的预测性能如表8所示。可以看出,对于模型M1,电池B0005、B0006、B0007和B0018的 分别为0.0062、0.0267、0.0070和0.0066,四个电池的 均小于模型M2和M3,且模型M2的 也均小于模型M3。在模型M1下,除B0007外的三个电池的 值分别为0、2和1,也均小于模型M2和模型M3的 值。而且,模型M2除了B0018的 值比模型M3大1之外,模型M2也比模型M3具有优势。从 可以看出,模型M1比模型M2、M3具有更好的预测精度,且本文提取的HIs经过PCA融合后的预测性能也优于其他HI。模型M1的四个电池的 分别为0.9946、0.9400、0.9893和0.9572,明显大于模型M2和M3电池的 ,这充分说明模型M1的预测结果比模型M2、M3能更好拟合原始退化曲线。此外,除了B0018之外,模型M2的其余三个电池的 也均明显大于模型M3,表明经过PCA融合后的HI的预测结果与原始曲线的拟合程度优于模型M3的HI。对比实验结果表明,同样的HIs经过SAE融合之后比经过PCA融合的HI预测性能更好,说明SAE用于特征融合的效果优于PCA。此外,本工作提取的潜在HIs经过融合之后的HI预测性能优于其他HI,说明了本工作提取的HIs的有效性与优越性。

表8   不同模型(M1、M2和M3)的预测性能

4 结论

本文提出了一种基于SVD-SAE-GPR的锂离子电池RUL预测方法。主要贡献如下。首先,为了解决传统特征提取方法依赖于参数设定且对于不同锂离子电池数据集适应性差的缺点,将SVD用于特征提取解决上述问题。然后,从原始测量数据和计算出的包含更多退化信息的特征提取对象中提取了15个潜在HIs。考虑到HIs的冗余和不足会影响RUL预测,将Spearman相关分析和SAE用于处理潜在HIs得到一个融合HI。最后,将融合HI与GPR相结合进行RUL预测,并给出结果的不确定性表达。在验证阶段,在NASA和MIT提供的电池数据集上的实验结果说明了该特征提取策略的有效性和适应性。通过与PCA融合HI和其他HI进行比较,验证了所提HI的优越性。综上所述,SVD特征提取方法具有良好的适应性,提取出的潜在HIs使用Spearman相关分析和SAE得到的融合HI具有较好的预测性能,所提出的RUL预测框架具有较高的精度且输出概率等优点。本文的方法也具有一定的局限性。比如,锂离子电池的实验室数据根据实验条件和测量仪器的不同,测量出来的数据可能会存在差异,而这些差异是否影响SVD特征提取,是否需要对数据做进一步的处理,是需要通过具体的测量数据进一步研究的。此外,在电池出厂之后,无法获得实验室数据的情况和在使用阶段比较复杂的工况下,测量数据可能有一定的难度,因此该方法适用性需进一步探究。

第一作者: 董渊昌(1999—),男,硕士研究生,研究方向为复杂系统的故障预测与健康管理,E-mail:;

通讯作者: 庞晓琼,副教授,研究方向为复杂系统的故障预测与健康管理、信息安全与密码学,E-mail:xqpang@nuc.edu.cn。

本刊推荐

(点击图片可跳转到相应文章合集)

邮发代号:80-732
联系热线:010-64519601/9602/9643
投稿网址:http://esst.cip.com.cn/CN/2095-4239/home.shtml

版权:如无特殊注明,文章转载自网络,侵权请联系cnmhg168#163.com删除!文件均为网友上传,仅供研究和学习使用,务必24小时内删除。
相关推荐