期刊文章详细信息
文献类型:期刊文章
机构地区:[1]新疆大学现代教育技术中心,新疆乌鲁木齐830046 [2]新疆大学信息科学与工程学院,新疆乌鲁木齐830046
基 金:国家自然科学基金资助项目(61063026;61163028)
年 份:2012
卷 号:34
期 号:12
起止页码:150-154
语 种:中文
收录情况:BDHX、BDHX2011、CSCD、CSCD2011_2012、INSPEC、ZGKJHX、核心刊
摘 要:文本自动分类技术在提高文本信息利用的有效性和准确性上具有重要的现实意义和广阔的应用前景。随着Internet上维吾尔文信息的迅速发展,维吾尔文文本分类成为处理和组织这些大量文本数据的关键技术。研究维吾尔文文本分类相关技术和方法,针对维吾尔文文本在向量空间模型表示下的高维性,本文采用词干提取和χ2统计量相结合的方法对表示空间进行降维。采用SVM算法构造了维吾尔文文本分类器。针对维吾尔文文本分类语料进行的实验结果表明,SVM分类器的MacroF1值达到了84.6%,明显好于kNN方法。
关 键 词:文本分类 SVM KNN 维吾尔语
分 类 号:TP391.1]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...