Multi-label multi-lead arrhythmia classification method based on fusion neural network
附图说明 图1为基于融合神经网络的多标签多导联心律失常分类流程结构图。 图2为残差基础结构图。 图3为GRU单元结构图。 技术领域 本发明涉及心电信号分类技术领域,具体涉及一种基于融合神经网络的多标签多导联心律失常分类方法。 具体实施方式 下面将结合附图1、附图2、附图3对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。 参见图1,基于融合神经网络的多标签多导联心律失常分类方法包括如下步骤: a)将原始心电信号经过预处理后输入到由卷积神经网络构成的心电局部特征提取模块进行多导联心电信号的局部显著性特征提取。 b)将卷积神经网络提取到的浅层心电信号特征输入到循环神经网络构成的心电时序特征提取模块进行多导联心电信号的时序特征提取。 c)融合心电局部显著性特征与心电时序特征,形成最终用于分类的心电特征。 d)将融合后的心电特征输入线性分类层,输出多标签类别。 e)使用推广至多标签场景的Softmax结合交叉熵损失函数,进行网络训练。 步骤a)中原始心电信号的预处理的具体过程为:将原始心电信号进行滤波处理,滤除基线漂移干扰和工频干扰。对其进行数据增强处理,增加模型训练的样本,最后对其进行重采样处理。所述滤波处理为,使用截止频率为0.1Hz的IIR高通滤波器对ECG信号进行处理,滤除ECG信号的基线漂移干扰,使用IIR陷波滤波器对滤除基线漂移干扰后的ECG信号进行处理,滤除50Hz的工频干扰,得到滤波后的ECG信号。所述数据增强处理为,将滤波后的ECG信号随机进行上下竖直翻转、随机上下平移10个以内采样点,以增加数据的样本。所述重采样处理为:将数据增强后的数据集样本,全部重采样为C*2048的信号,C为ECG信号的导联数。 步骤a)中的心电局部特征提取模块为一维ResNet18模型,参见图2,利用基础残差结构将任意一层的输出恒等映射到另一层,避免了梯度消失或梯度爆炸导致的网络退化问题,使得网络加深成为可能,能更好地提取ECG信号的局部显著性特征。 所述一维ResNet18网络模型结构如表所示,包括第一个卷积层、最大池化层、残差卷积结构层以及平均池化层。所述第一个卷积层采用64个尺度为15的卷积核,滑动步长为2,边缘填充值为7。所述最大池化层滑动步长为2。所述残差卷积层中卷积核的个数分别为[64 128 256512],卷积核尺度为7,边缘填充值为3。残差卷积层的结构为[2 2 2 2],每一个残差层中包含两个相同的基础残差结构,每个残差基础结构中包含两个卷积核个数相同的卷积层。所述ResNet18网络输入为C*2048的多导联多标签心电数据,输出为512*1的心电局部特征。 步骤b)中的心电时序特征提取模块为3层GRU网络,其输入为步骤a)中心电局部特征提取模块第一个卷积层输出的浅层心电特征。参见图3,所述GRU单元由更新门和重置门构成,其中更新门决定当前时间状态和前一个时间状态的信息有多少需要继续传递。其输入为当前输入和上一时刻输入线性变换后拼接,通过sigmoid激活函数得到保留当前信息和前面信息的概率值。重置门决定忘记多少过去的信息。输入同更新门一致,区别只在于线性变换的参数和用处不同。首先门控信号通过重置门进行重置,之后与输入进行拼接。拼接后的数据被tanh激活函数缩放到-1~1的范围,得到包含当前输入的数据。在更新记忆阶段,同时进行遗忘操作和记忆操作。 所述3层GRU网络结构如表所示,GRU单元的隐藏层参数分别为[64 64 1],GRU网络的输入为64*1024的浅层心电特征,输出为64*1的心电时序特征。 步骤c)中的心电局部特征与心电时序特征融合过程为,将心电局部特征与心电时序特征进行在第一维度上进行特征拼接,512*1的心电局部特征与64*1的心电时序特征拼接成为576*1的心电特征,用于网络训练。 步骤d)线性分类层为Linear层,其输入为所述融合后576*1的心电特征,输出为N*1的多标签心电数据集的标签类别,N为数据集中标签的种类数。 步骤e)中用于网络训练的损失函数为推广至多标签场景的Softmax结合交叉熵损失函数。将网络输出层对各个类别的得分定义为s1,s2,...,sn,将所有非目标类得分s1,s2,...st-1,st+1,...,sn与目标类得分st两两作差比较,并使得非目标类得分与目标类得分的差值最大值尽可能小于0。由于多标签分类需要输出的类别数目不确定,引入一个额外的0类,希望目标类的分数都比0类的得分s0大,此时损失函数可以写为: 其中neg,pos分别表示正负样本集合,C表示标签的类别数。假定s0=0,则将上述损失函数的公式简化为: 最后应说明的是:以上所述仅为本发明的一种较为合理的实施方式,并不用于限制本发明,尽管参照前述实例对本发明进行了详细的说明,对于本领域的技术人员来说,依然可以对前述各实例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。 背景技术 心血管疾病对人类生命健康安全有着极大的威胁,根据世界卫生组织在2018年发布的《2018世界卫生统计报告》,2016年度全球范围内约有1790万人因心血管疾病死亡,约占该年度全球死亡人数的31.4%,占该年度慢性非传染性疾病死亡人数的44%。如何充分发挥信息学科的优势,尤其是近年来快速发展的人工智能技术,通过医工交叉创新,实现心血管疾病的早期预防、早期检测和早期治疗,切实减轻医生负担,提高疾病防治效率,减少诊断治疗过程中的医疗资源浪费,成为心血管疾病防治的关键和重点。 心电检测在心律失常、心肌梗死等心血管疾病方面的预警作用不可替代,是最常应用于临床的诊断技术之一。随着机器学习技术与深度学习技术的发展,医疗领域数据的增加,计算机辅助心电图自动诊断算法的研究也得到了发展,其应用越来越广泛。在计算机辅助心电图自动诊断研究领域,针对二分类和多分类的心电图诊断取得了一定的成果。实际临床中,各种心律失常类型存在交叉重叠且可以互相转化的情况,一个心血管疾病患者可能同时对应多种心律失常类型,这种情况称之为心电多标签现象。心电多标签现象普遍存在于临床心电数据库中。 设计合理的网络结构提取ECG信号的局部显著性特征以及时序特征,以提高心电多标签分类模型的性能,是多标签多导联心律失常分类任务急需解决的问题之一。多标签心电分类任务中应用深度学习技术的研究也通常参考心电多分类任务研究中的网络结构。按照网络结构可以将其分为三类:深度卷积神经网络CNN、循环神经网络RNN、以及深度卷积神经网络CNN与循环神经网络RNN结合的网络结构。第一类深度卷积神经网络CNN能提取更丰富的信号浅层特征和深层语义特征。但ECG信号是时间序列信号,具有丰富的时序特征,深度卷积神经网络只能捕获ECG信号波形的局部特征,而无法捕获ECG信号间的时序特征。第二类循环神经网络RNN对当前信息的学习依赖于当前序列的信息,在提取时间序列特征的任务上有良好的表现,在心电多分类任务上也有广泛应用,能够捕获ECG信号的时序特征,循环神经网络的不足之处在于舍弃了ECG信号的局部特征。第三类深度卷积神经网络CNN与循环神经网络RNN结合的网络能够同时捕获ECG信号的局部特征和时序特征。这类网络结构通常使用LSTM与CNN进行组合,但现有研究中这类模型的CNN层数过少,使得模型泛化性能较差,同时由于LSTM网络结构过于复杂,耗费了大量的时间和资源。 此外,如何设计合理的目标函数以缓解数据集的不平衡问题也是多标签多导联心律失常分类任务急需解决的问题之一。多标签心电数据集普遍存在数据不平衡现象,主要体现在两个方面,一是正负样本不平衡,存在负样本数量远多于负样本数量的现象;二是各个异常类型间存在不平衡问题,例如出现肺型P波等标签的样本数量要远远小于出现窦性心律等标签的样本数量。而在多标签心电分类任务中,模型的任务是判断一个样本是否同时存在标签空间中存在的全部心电类型。 通常多标签分类问题的解决方案为将其转化为多个二分类问题,其目标函数为结合sigmoid函数与交叉熵损失函数,该方案对于正负样本的关注度相同,在数据分布不平衡的情况下,样本量少的类别在网络训练过程中发挥的作用要小于样本量多的类别,导致模型难以正确学习样本量少的类别所包含的信息,最终模型的预测结果倾向于样本量多的类别。 发明内容 本发明的目的是提供一种基于融合神经网络的多标签多导联心律失常分类方法,解决现有神经网络模型无法同时提取并利用ECG信号的局部显著性特征以及时序特征的问题,同时提出了一种将softmax激活函数结合交叉熵损失的损失函数设计方案,缓解了多标签心电数据集的数据不平衡问题。 本发明所采用的技术方案是,一种基于融合神经网络的多标签多导联心律失常分类方法,包括如下步骤: a)将原始心电信号经过预处理后输入到由卷积神经网络构成的心电局部特征提取模块进行多导联心电信号的局部显著性特征提取。 b)将卷积神经网络提取到的浅层心电信号特征输入到循环神经网络构成的心电时序特征提取模块进行多导联心电信号的时序特征提取。 c)融合心电局部显著性特征与心电时序特征,形成最终用于分类的心电特征。 d)将融合后的心电特征输入线性分类层,输出多标签类别。 e)使用推广至多标签场景的Softmax结合交叉熵损失函数,进行网络训练。 作为本发明的进一步改进,将原始心电信号进行预处理的具体过程为:将原始心电信号进行滤波处理,滤除基线漂移干扰和工频干扰。对其进行数据增强处理,增加模型训练的样本,最后对其进行重采样处理。 作为本发明的进一步改进,步骤a)所述滤波处理为,使用IIR高通滤波器对ECG信号进行处理,滤除ECG信号的基线漂移干扰,所述IIR高通滤波器的截止频率为0.1Hz。使用IIR陷波滤波器对滤除基线漂移干扰后的ECG信号进行处理,滤除工频干扰,所述IIR陷波滤波器的滤除频率为50Hz。最后得到滤波后的ECG信号。所述数据增强处理为,将滤波后的ECG信号随机进行上下竖直翻转、随机上下平移10个以内采样点,以增加数据的样本。所述重采样处理为:将数据增强后的数据集样本,全部重采样为C*2048的信号,C为ECG信号的导联数。 作为本发明的进一步改进,步骤a)所述心电局部特征提取模块为一维ResNet18模型的结构,模块输入为经过预处理的ECG信号。所述模块结构分为第一个卷积层、最大池化层、残差卷积结构层以及平均池化层。所述第一个卷积层采用64个尺度为15的卷积核,滑动步长为2,边缘填充值为7。所述最大池化层滑动步长为2。所述残差卷积层中卷积核的个数分别为[64 128 256 512],卷积核尺度为7,边缘填充值为3。残差卷积层的结构为[2 2 22],每一个残差层中包含两个相同的基础残差结构,每个残差基础结构中包含两个卷积核个数相同的卷积层。残差基础结构通过跳跃连接将某一层的输入恒等映射到任意一层,解决了网络退化问题导致的梯度消失与梯度弥散问题。 作为本发明的进一步改进,步骤b)所述心电时序特征提取模块为3层GRU结构,GRU的隐藏层维度为[64 64 1]。所述模块输入为步骤a)所述心电局部特征提取模块中第一个卷积层输出的浅层心电特征。所述GRU单元由两个门组成,分别为重置门和更新门,其中更新门决定当前时间状态和前一个时间状态的信息有多少需要继续传递。其输入为当前输入和上一时刻输入线性变换后拼接,通过sigmoid激活函数得到保留当前信息和前面信息的概率值。重置门决定忘记多少过去的信息。输入同更新门一致,区别只在于线性变换的参数和用处不同。首先门控信号通过重置门进行重置,之后与输入进行拼接。拼接后的数据被tanh激活函数缩放到-1~1的范围,得到包含当前输入的数据。在更新记忆阶段,同时进行遗忘操作和记忆操作。 作为本发明的进一步改进,步骤c)所述心电局部特征与心电时序特征融合过程为,将心电局部特征与心电时序特征进行拼接,在第一维度上进行特征拼接,成为网络训练的心电特征。 作为本发明的进一步改进,步骤d)所述线性分类层为Linear层,其输入为所述融合后心电特征,输出为多标签心电数据集的标签类别。 作为本发明的进一步改进,步骤e)所述多标签损失函数为单标签多分类场景下softmax激活函数与交叉熵损失函数结合的拓展。假设网络输出层对各个类别的得分分别为s1,s2,...,sn,交叉熵损失函数相当于将所有非目标类得分s1,s2,...st-1,st+1,...,sn与目标类得分st两两作差比较,并使得非目标类得分与目标类得分的差值最大值尽可能小于0。对于多标签分类,由于希望模型输出的类别k值不确定,需要根据阈值确定模型输出哪些类,对此,引入一个额外的0类,我们希望目标类的分数都比0类的得分s0大,而非目标类的得分都比s0小,此时损失函数可以写为: 其中neg,pos分别表示正负样本集合,C表示标签的类别数。假定s0=0,则将上述损失函数的公式简化为: 与现有技术相比,本发明的有益效果如下: 1.本发明结合卷积神经网络与循环神经网络,卷积神经网络采用ResNet结构,在有效提取心电信号局部显著性特征的同时,其残差结构通过跳跃连接能够有效避免梯度消失导致的网络退化问题。循环神经网络采用GRU单元,能够有效提取时序信号的时序特征,并且训练速度快,性能好。融合ResNet与GRU使模型同时拥有提取心电局部显著性特征与时序特征的能力,能够有效地提取心电信号的特征,提高模型在多标签心电数据集上的表现性能。 2.本发明不再将多标签分类问题转化为多个二分类问题,而是将其看作为目标类得分与非目标类得分两两比较的问题,能够自动平衡类别间的权重,缓解多标签心电数据集的不平衡问题,同时无需额外通过权重矩阵来缓解不平衡,减少了算法的复杂度,同时提升了模型在多标签心电数据集上的表现性能。 The invention discloses a multi-label multi-lead arrhythmia classification method based on a fusion neural network. The method comprises the specific steps that original electrocardiosignals are preprocessed and then input into an electrocardiograph local feature extraction module composed of a convolutional neural network, and local saliency feature extraction of the multi-lead electrocardiosignals is carried out; superficial electrocardiosignal features extracted by the convolutional neural network are input into an electrocardiosignal time sequence feature extraction module formed by a recurrent neural network for time sequence feature extraction of multi-lead electrocardiosignals. And the electrocardio local saliency features and the electrocardio time sequence features are fused to form electrocardio features for classification finally. And inputting the fused electrocardio characteristics into a linear classification layer, and outputting a multi-label category. And performing network training by using Softmax popularized to a multi-label scene in combination with a cross entropy loss function. According to the method, the local significant features and the time sequence features of the electrocardiosignals can be extracted at the same time, the problem of data imbalance of a multi-label data set can be relieved, and the method has good performance. 1.基于融合神经网络的多标签多导联心律失常分类方法,其特征在于,包括如下步骤: a)将原始心电信号经过预处理后输入到由卷积神经网络构成的心电局部特征提取模块进行多导联心电信号的局部显著性特征提取; b)将卷积神经网络提取到的浅层心电信号特征输入到循环神经网络构成的心电时序特征提取模块进行多导联心电信号的时序特征提取; c)融合心电局部显著性特征与心电时序特征,形成最终用于分类的心电特征; d)将融合后的心电特征输入线性分类层,输出多标签类别; e)使用推广至多标签场景的Softmax结合交叉熵损失函数,进行网络训练。 2.根据权利要求1所述的基于融合神经网络的多标签多导联心律失常分类方法,其特征在于,步骤a)中所述心电局部特征提取模块采用一维ResNet18模型作为网络结构;网络的输入为C*2048的心电数据,C为心电信号的导联数;第一层卷积层采用64个尺度为15的卷积核,滑动步长为2,边缘填充值为7,该卷积层输出64*1024的浅层心电信号特征;该卷积层后连接一个最大池化层,滑动步长为2;最大池化层输出维度为最大池化层后连接残差卷积结构,残差卷积结构中所有卷积核的尺度为7,边缘填充值为3;残差卷积结构共四层,堆叠情况为[2 2 2 2],每个残差卷积结构中包含2个上述卷积层,并重复2次,共16个卷积层;每个残差卷积结构中的卷积核个数分别为[64 128 256 512],最后一个卷积层输出512*64的特征;卷积层后连接平均池化层,输出维度为512*1的心电局部显著性特征。 3.根据权利要求2所述的基于融合神经网络的多标签多导联心律失常分类方法,其特征在于,步骤b)中所述心电时序特征提取模块采用3层GRU作为网络结构;其输入为提取到的浅层心电信号特征,输入维度为64*1024,GRU的隐藏层维度为[64 64 1],输出为64*1的心电时序特征。 4.根据权利要求1所述的基于融合神经网络的多标签多导联心律失常分类方法,其特征在于,步骤c)中融合心电局部显著性特征与心电时序特征,采用的融合操作为拼接操作,融合后最终用于分类的心电特征维度为576*1。 5.根据权利要求1所述的基于融合神经网络的多标签多导联心律失常分类方法,其特征在于,步骤d)中将融合后的心电特征输入线性分类层,输出多标签类别;线性层输入为576*1,输出为N*1,N为心电数据集的类别数。 6.根据权利要求书1所述的基于融合神经网络的多标签多导联心律失常分类方法,其特征在于,步骤e)中将softmax激活函数结合交叉熵损失函数的方案推广至多标签数据集,将多标签分类问题转化为目标类得分与非目标类得分两两比较的问题,自动平衡类别间的权重;其目标函数为 7.根据权利要求1所述的基于融合神经网络的多标签多导联心律失常分类方法,其特征在于,步骤a)中将原始心电信号进行预处理的具体过程为:将原始心电信号进行滤波处理,滤除基线漂移干扰和工频干扰;对其进行数据增强处理,增加模型训练的样本;最后对其进行重采样处理。 8.根据权利要求7所述的基于融合神经网络的多标签多导联心律失常分类方法,其特征在于,所述滤波处理为,使用IIR高通滤波器对ECG信号进行处理,滤除ECG信号的基线漂移干扰,所述IIR高通滤波器的截止频率为0.1Hz;使用IIR陷波滤波器对滤除基线漂移干扰后的ECG信号进行处理,滤除工频干扰,所述IIR陷波滤波器的滤除频率为50Hz;最后得到滤波后的ECG信号;所述数据增强处理为,将滤波后的ECG信号随机进行上下竖直翻转、随机上下平移10个以内采样点,以增加数据的样本;所述重采样处理为:将数据增强后的数据集样本,全部重采样为C*2048的信号,C为ECG信号的导联数。