基于CNN和双向gru的心跳分类系统

2023-12-29 北京

阅读 2 分钟

0

CNN and Bidirectional GRU-Based Heartbeat Sound Classification Architecture for Elderly People是发布在2023 MDPI Mathematics上的论文，提出了基于卷积神经网络和双向门控循环单元(CNN + BiGRU)注意力的心跳声分类，论文不仅显示了模型还构建了完整的系统。

以前的研究

论文总结了以前的研究

数据集和预处理

应用层显示了应用区域，包括医院、政府办公室、救护车、养老院和体育馆。

数据层，处理实时数据采集，如数字或模拟听诊器，机电薄膜(EMFi)传感器，智能手机。

智能层是包含深度学习模型的层。

CirCor数据集

使用CirCor数据集，总共从942名患者中获得3007个录音，包含499个杂音和2508个正常录音。为了解决这个类不平衡问题，论文进行了欠采样。对于欠采样，杂音类使用489个录音，正常类使用489个随机选择的录音。然后将该数据集按70:30的比例分为训练数据和测试数据。

数据增强

时间拉伸：音高移动和音频移动使得总的训练数据变成了原来684个片段大小的3倍。

调高音高:在不改变节奏的情况下，调高或调低音高。半音在-4到+4的范围内随机选择。应用此转换的概率设为0.5。

音频移位:用于向前或向后移动音频样本，有或没有任何翻转。

预处理

数据预处理包括对给定音频信号进行滤波、归一化和下采样。

对给定的音频数据集进行滤波，可以去除录制过程中由于各种环境条件而产生的噪声。

归一化是通过归一化+1到-1范围内的每一类心跳声音来改进训练过程。

信号的下采样率为22050，频率范围为30至1200 Hz。

CNN + BiGRU

作者试图直接在原始时间序列数据上进行训练，但是这导致梯度消失问题和非常长的训练时间。另一种选择是使用色谱图[56]，这也是一种与MFCC类似的特征提取方法，但会导致训练不稳定。所以作者最终决定使用MFCC。

CNN + BiGRU模型

由CNN + BiGRU组成的深度学习模型，并使用注意力模型对音频样本进行推理。

在通过GRU单元对时间序列数据进行处理之前，对二维卷积层进行批处理归一化和概率为0.3的Dropout，防止过拟合和泄漏

CNN层期望提取关键的MFCC系数，并以时间序列数据的形式提供给BiGRU层。

BiGRU学习重要的特征，并通过Dropout(防止过拟合)将它们传递给另一个BiGRU层，以提供从mfc中提取的最终特征给前馈神经网络(FFNN)进行预测。FFNN的第一层使用tanh激活，而第二层使用sigmoid激活，因为它是一个二元分类问题。

结果

方法性能对比

采用注意模型的CNN+BiGRU整体验证精度优于其他模型。

与其他模型相比，所提出的体系结构具有更少的训练计算时间复杂度。

消融研究

Adam优化器产生最佳结果。

用MFCC训练非常稳定，收敛速度很快。

数据增强在很大程度上提高了验证的准确性，并有助于对抗过拟合。

论文地址：https://avoid.overfit.cn/post/91ab2a0758e24fe98158f47cabff2468

人工智能深度学习神经网络

本文系转载，阅读原文

https://avoid.overfit.cn/post/91ab2a0758e24fe98158f47cabff2468

阅读 597发布于 2023-12-29

deephub

125 声望111 粉丝

« 上一篇

人工智能生成文本检测在实践中使用有效性探讨

下一篇 »

使用LOTR合并检索提高RAG性能

引用和评论

推荐阅读

提升模型泛化能力：PyTorch的L1、L2、ElasticNet正则化技术深度解析与代码实现

deephub

一文掌握 MCP 上下文协议：从理论到实践

陈明勇赞 6阅读 2k

AI Agent爆火后，MCP协议为什么如此重要！

程序员海军赞 5阅读 548

AdventureX 2025 正式启动：五天四夜，120小时极限创造！一起在杭州点燃青年创新之火！

思否编辑部赞 2阅读 5.4k

MCP 协议为何不如你想象的安全？从技术专家视角解读

Baihai_IDP赞 2阅读 575

🔥吐血整理 Bolt.diy 部署与应用攻略

北京宏哥阅读 6.1k

常见的 AI 模型格式

HuggingFace赞 1阅读 734

0 条评论

评论支持部分 Markdown 语法：**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用 @ 来通知其他用户。