登录    注册    忘记密码

期刊文章详细信息

基于类别信息和特征熵的文本特征权重计算    

Feature weighting scheme based on category information and term entropy

  

文献类型:期刊文章

作  者:阿力木江·艾沙[1,2] 殷晓雨[2] 库尔班·吾布力[2] 李喆[1]

Alimjan Aysa;Yin Xiaoyu;Kurban Ubul;Li Zhe(Network&Information Technology Center,Xinjiang University,Urumqi 830046,China;School of Information Science&Engineering,Xinjiang University,Urumqi 830046,China)

机构地区:[1]新疆大学网络与信息技术中心,乌鲁木齐830046 [2]新疆大学信息科学与工程学院,乌鲁木齐830046

出  处:《计算机应用研究》

基  金:新疆维吾尔自治区自然科学基金资助项目(2016D01C068)

年  份:2019

卷  号:36

期  号:11

起止页码:3237-3239

语  种:中文

收录情况:AJ、BDHX、BDHX2017、CSA-PROQEUST、CSCD、CSCD_E2019_2020、IC、INSPEC、JST、RCCSE、UPD、ZGKJHX、ZMATH、核心刊

摘  要:基于类别信息的特征权重计算方法对特征与类别的关系表达不够准确,即对于类别频率相同的特征无法比较其对类别的区分能力,因此要考虑特征在类内的分布情况。将特征的反类别频率(inverse category frequency,ICF)和类内熵(entropy)相结合引入到特征权重计算方案中,构造了两种有监督特征权重计算方案。在维吾尔文文本分类语料上进行的实验结果表明,该方法能够明显改善样本的空间分布状态并提高维吾尔文文本分类的微平均F 1值。

关 键 词:文本分类 文本特征 权重计算  类别频率  

分 类 号:TP391.1]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心