登录    注册    忘记密码

期刊文章详细信息

面向音频检索的音频分割和标注研究    

Research on audio segmentation and annotation for audio retrieval

  

文献类型:期刊文章

作  者:孙卫国[1] 夏秀渝[1] 乔立能[1] 叶于林[2]

Sun Weiguo Xia Xiuyul Qiao Lineng Ye Yulin(College of Electronics and Information,Sichuan University, Chengdu 610064 ,China 78438 Troops of the Chinese People's Liberation Army, Chengdu 610066, China)

机构地区:[1]四川大学电子信息学院 [2]中国人民解放军78438部队

出  处:《微型机与应用》

年  份:2017

卷  号:36

期  号:5

起止页码:38-41

语  种:中文

收录情况:JST、普通刊

摘  要:解决大规模音频数据库快速检索的有效手段之一是建立合适的音频索引,其中音频分割和标注是建立音频索引的基础。文中采用了一种基于短时能量和改进度量距离的两步音频分割算法,使得分割后的音频片段具有段间特征差异大、段内特征方差小的特点。在音频分割的基础上进行了音频数据库中音频流的标注;分别基于BP神经网络算法和Philips音频指纹算法对音频进行了音频类别和音频内容的标注,为后续建立音频索引表做准备。实验结果表明,两步分割算法能较好地分割任意音频流,音频标注算法能有效进行基于音频类别和音频内容的标注,算法同时具有良好的鲁棒性。

关 键 词:音频分割 短时能量  度量距离  音频标注  BP神经网络 音频指纹  

分 类 号:TN912.3]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心