登录    注册    忘记密码

期刊文章详细信息

基于特征语谱图和自适应聚类SOM的快速说话人识别    

Fast Speaker Recognition Based on Characteristic Spectrogram and an Adaptive Clustering Self-organizing Feature Map

  

文献类型:期刊文章

作  者:贾艳洁[1] 陈曦[1] 于洁琼[1] 王连明[1]

JIA Yan-jie;CHEN Xi;YU Jie-qiong;WANG Lian-ming(Institute of Computational Intelligence,School of Physics,Northeast Normal University,Changchun 130024,China)

机构地区:[1]东北师范大学物理学院计算智能研究所

出  处:《科学技术与工程》

基  金:国家自然科学基金(21227008);吉林省科技发展计划项目(20170204035GX)资助

年  份:2019

卷  号:19

期  号:15

起止页码:211-218

语  种:中文

收录情况:BDHX、BDHX2017、RCCSE、ZGKJHX、核心刊

摘  要:为获得说话人发音特征,基于仿生思想,提出一种基于语谱图统计的方法,通过对说话人短时语谱图的线性叠加获得可表征说话人稳定发音特征的特征语谱图。为解决资源受限的设备中说话人识别系统网络训练速度慢、识别效率低的问题,基于传统自组织映射(self-organizing feature map,SOM)神经网络提出了一种自适应聚类SOM (adaptive clustering-SOM,ACSOM)算法,随着待识别说话人数的增加,自动调节增加竞争层神经元个数,直至聚类数达到说话人个数。采用该AC-SOM模型对100人的自建特征语谱图样本库进行聚类识别,最大训练时间只需304 s,最大单张识别时间小于28 ms;在识别人数相同时,相对于所对比的其他识别方法,该方法大大提升了网络训练速度和识别速度,满足了边缘智能(edge intelligence)系统中对数据处理与执行的实时性的要求。

关 键 词:说话人识别 特征语谱图  自适应聚类 神经网络 统计  深度学习  

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心