期刊文章详细信息
文献类型:期刊文章
Liao Liefa Le Fugang Zhu Yalan(School of Information Engineering, Jiangxi University of Science and Technology, Ganzhou 341000, China)
机构地区:[1]江西理工大学信息工程学院,江西赣州341000
基 金:国家自然科学基金项目"创新网络异质性与企业创新绩效关系研究"(项目编号:71462018);江西省研究生创新专项基金资助项目"基于领域知识的LDA主题模型"(项目编号:YC2015-S304)
年 份:2017
卷 号:37
期 号:3
起止页码:35-39
语 种:中文
收录情况:BDHX、BDHX2014、CSSCI、CSSCI2017_2018、JST、NSSD、RCCSE、RWSKHX、ZGKJHX、核心刊
摘 要:对传统专利文本自动分类方法中,使用向量空间模型文本表示方法存在的问题,提出一种基于LDA模型专利文本分类方法。该方法利用LDA主题模型对专利文本语料库建模,提取专利文本的文档-主题和主题-特征词矩阵,达到降维目的和提取文档间的语义联系,引入类的类-主题矩阵,为类进行主题语义拓展,使用主题相似度构造层次分类,小类采用KNN分类方法。实验结果:与基于向量空间文本表示模型的KNN专利文本分类方法对比,此方法能够获得更高的分类评估指数。
关 键 词:LDA 主题模型 专利文本分类 主题相似度
分 类 号:G255.53[图书情报与档案管理类] G254.1
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...