期刊文章详细信息
文献类型:期刊文章
BAO Shanshu;CHE Bo;DENG Linhong(School of Computer Science and Artificial Intelligence,Changzhou University,Changzhou 213164,Jiangsu,China;Changzhou Key Laboratory of Respiratory Medical Engineering,Institute of Biomedical Engineering and Health Sciences,Changzhou University,Changzhou 213164,Jiangsu,China)
机构地区:[1]常州大学计算机与人工智能学院,江苏常州213164 [2]常州大学生物医学工程与健康科学研究院常州市呼吸医学工程重点实验室,江苏常州213164
基 金:国家自然科学基金(12272063,11532003)。
年 份:2023
卷 号:49
期 号:9
起止页码:295-302
语 种:中文
收录情况:AJ、BDHX、BDHX2020、CAS、CSCD、CSCD_E2023_2024、IC、JST、RCCSE、SCOPUS、UPD、ZGKJHX、核心刊
摘 要:针对目前肺音识别中因肺音数据集规模较小所致模型过拟合分类精度低的问题,提出一种基于双源域迁移学习的肺音识别方法。一方面,将音频数据集Audio Set上的预训练模型VGGish网络迁移至肺音识别中,融合高效通道注意力ECA-Net以增强识别能力,然后提取肺音的对数梅尔频率谱特征,使用VGGish网络按照时序学习谱图中的信息,并对VGGish网络输出的特征向量经不同大小和扩张率的一维卷积核进行特征增强,将增强后的特征图输入双向门控循环单元以捕获肺音的时序信息;另一方面,将图像数据集ImageNet上的预训练模型VGG19迁移至肺音识别中,将肺音波形数据转换为谱图的形式输入并训练。将两方面的模型训练后作为特征提取器,融合具有高层语义的特征向量融合并输入集成学习算法CatBoost,实现最终的分类。实验结果表明,该方法对Coswara新冠数据集中肺音识别的特异性、敏感性指标和准确率分别达到80.66%、77.69%和79.18%,对ICBHI-2017数据集中肺音识别的特异性、敏感性指标和ICHBI-score分别达到88.75%、72.04%和80.39%,均优于对比的常见识别方法。
关 键 词:肺音识别 迁移学习 通道注意力 对数梅尔频率谱 集成学习
分 类 号:TP399]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...