期刊文章详细信息
基于统计分布的中文专利自动分类方法研究
Research on Chinese Patent Automatic Classification Method Based on Statistical Distribution
文献类型:期刊文章
机构地区:[1]西安电子科技大学经济与管理学院,西安710071 [2]工业和信息化部电子科学技术情报研究所,北京100043
年 份:2013
期 号:7
起止页码:101-106
语 种:中文
收录情况:BDHX、BDHX2011、CSSCI、CSSCI2012_2013、RWSKHX、核心刊
摘 要:传统的基于向量空间模型的文本自动分类算法没有考虑到特征词的类间分布情况及特征词在文本内部的位置分布情况,导致该算法用于专利分类时效果不佳。提出一种基于统计分布的中文专利自动分类方法。首先,统计出特征词的类间分布信息,引入类间分散度加权因子,突出分布类别少、出现频率高的特征词的权重;其次,结合专利文本的结构特点,引入位置权重因子,突出专利的法律特性和技术特性以及组成专利各元素内容的差异性。最后通过对比实验证明,该方法能够有效提高中文专利自动分类的效果。
关 键 词:统计分布 专利自动分类 加权因子
分 类 号:TP391.1]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...