期刊文章详细信息
基于改进卡方统计的微博特征提取方法
Feature selection methods of microblogging based on improved CHI-square statistics
文献类型:期刊文章
机构地区:[1]北京工业大学现代教育技术中心,北京100124 [2]北京工业大学数理学院,北京100124
基 金:国家自然科学基金(No.61105040;No.61203284;No.61272361);北京市自然科学基金(No.4133085);北京市教委青年拔尖人才培育计划;北京工业大学数学统计学基础科学研究基金(No.006000542213501)
年 份:2014
卷 号:50
期 号:19
起止页码:113-117
语 种:中文
收录情况:AJ、CSA、CSA-PROQEUST、CSCD、CSCD2013_2014、IC、INSPEC、JST、RCCSE、ZGKJHX、普通刊
摘 要:通过对微博文本特征信息的分析与研究,提出一种基于改进卡方统计的微博特征提取方法。扩充微博信息分类特征,在传统的卡方统计量的基础上,引入了频度等因素,改进特征选择方法;在传统的特征项权值计算的基础上,提出了新的改进卡方统计量的方法,改进权重计算效果。对上述方法利用经典KNN和SVM算法进行了测试,实验结果表明该方法提高了微博信息分类的准确率。
关 键 词:微博分类 卡方统计量 特征选择 权值计算
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...