期刊文章详细信息
基于LLR融合基频与MFCC的说话人性别识别 ( EI收录)
Speaker gender identification based on linear logistic regression fusion of the pitch and MFCC
文献类型:期刊文章
机构地区:[1]北京大学深圳研究生院深圳物联网智能感知技术工程实验室,广东深圳518005 [2]北京大学深圳研究生院信息工程学院,广东深圳518005
基 金:国家自然科学基金资助项目(60875050;60675025);国家高技术研究发展计划资助项目(2006AA04Z247);深圳市科技计划资助项目(JC201005280682A;JCYJ20120614152234873;CXC201104210010A)
年 份:2013
卷 号:41
期 号:S1
起止页码:184-187
语 种:中文
收录情况:AJ、BDHX、BDHX2011、CAS、CSA、CSA-PROQEUST、CSCD、CSCD2013_2014、EI、IC、INSPEC、JST、MR、RCCSE、SCOPUS、ZGKJHX、ZMATH、核心刊
摘 要:提出了一种基于线性逻辑回归的方法,对利用基频和MFCC特征获得的分数进行融合来进行说话人的性别识别,其中包括了基于基频特征的单高斯模型和基于MFCC特征的混合高斯模型.采用语音库包括男性语音文件150个,女性语音文件190个.实验结果中识别率可高达97.65%,比传统单用基频或是MFCC特征的识别率都要高,具有更好的判别性能.
关 键 词:音频信号处理 声流 鉴定 性别识别 基频 MEL频率倒谱系数 线性逻辑回归
分 类 号:TN912.3]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...