期刊文章详细信息
文献类型:期刊文章
Alimjan Aysa;Yin Xiaoyu;Kurban Ubul;Li Zhe(Network&Information Technology Center,Xinjiang University,Urumqi 830046,China;School of Information Science&Engineering,Xinjiang University,Urumqi 830046,China)
机构地区:[1]新疆大学网络与信息技术中心,乌鲁木齐830046 [2]新疆大学信息科学与工程学院,乌鲁木齐830046
基 金:新疆维吾尔自治区自然科学基金资助项目(2016D01C068)
年 份:2019
卷 号:36
期 号:11
起止页码:3237-3239
语 种:中文
收录情况:AJ、BDHX、BDHX2017、CSA-PROQEUST、CSCD、CSCD_E2019_2020、IC、INSPEC、JST、RCCSE、UPD、ZGKJHX、ZMATH、核心刊
摘 要:基于类别信息的特征权重计算方法对特征与类别的关系表达不够准确,即对于类别频率相同的特征无法比较其对类别的区分能力,因此要考虑特征在类内的分布情况。将特征的反类别频率(inverse category frequency,ICF)和类内熵(entropy)相结合引入到特征权重计算方案中,构造了两种有监督特征权重计算方案。在维吾尔文文本分类语料上进行的实验结果表明,该方法能够明显改善样本的空间分布状态并提高维吾尔文文本分类的微平均F 1值。
关 键 词:文本分类 文本特征 权重计算 类别频率
分 类 号:TP391.1]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...