登录    注册    忘记密码

期刊文章详细信息

基于改进卡方统计的微博特征提取方法    

Feature selection methods of microblogging based on improved CHI-square statistics

  

文献类型:期刊文章

作  者:徐明[1] 高翔[2] 许志刚[2] 刘磊[2]

机构地区:[1]北京工业大学现代教育技术中心,北京100124 [2]北京工业大学数理学院,北京100124

出  处:《计算机工程与应用》

基  金:国家自然科学基金(No.61105040;No.61203284;No.61272361);北京市自然科学基金(No.4133085);北京市教委青年拔尖人才培育计划;北京工业大学数学统计学基础科学研究基金(No.006000542213501)

年  份:2014

卷  号:50

期  号:19

起止页码:113-117

语  种:中文

收录情况:AJ、CSA、CSA-PROQEUST、CSCD、CSCD2013_2014、IC、INSPEC、JST、RCCSE、ZGKJHX、普通刊

摘  要:通过对微博文本特征信息的分析与研究,提出一种基于改进卡方统计的微博特征提取方法。扩充微博信息分类特征,在传统的卡方统计量的基础上,引入了频度等因素,改进特征选择方法;在传统的特征项权值计算的基础上,提出了新的改进卡方统计量的方法,改进权重计算效果。对上述方法利用经典KNN和SVM算法进行了测试,实验结果表明该方法提高了微博信息分类的准确率。

关 键 词:微博分类  卡方统计量  特征选择  权值计算

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心