登录    注册    忘记密码

期刊文章详细信息

挖掘专利知识实现关键词自动抽取  ( EI收录)  

Mining Patent Knowledge for Automatic Keyword Extraction

  

文献类型:期刊文章

作  者:陈忆群[1,2] 周如旗[2] 朱蔚恒[3] 李梦婷[4] 印鉴[1]

机构地区:[1]中山大学计算机科学系,广州510275 [2]广东第二师范学院计算机科学系,广州510303 [3]暨南大学信息科学技术学院,广州510632 [4]珠海魅族科技有限公司,广东珠海519085

出  处:《计算机研究与发展》

基  金:国家自然科学基金项目(61472453;U1401256;U1501252);广东省科技计划基金项目(2012A010701013)~~

年  份:2016

卷  号:53

期  号:8

起止页码:1740-1752

语  种:中文

收录情况:AJ、BDHX、BDHX2014、CSA-PROQEUST、CSCD、CSCD2015_2016、EI、IC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊

摘  要:关键词是人们快速判断是否要详细阅读文件内容的重要线索,关键词自动抽取在信息检索、自然语言处理等研究领域均有重要应用.设计了一种新的关键词自动抽取方法,使计算机能够像人类专家一样,利用知识库对目标文本进行学习和理解,最终自动抽取出关键词.专利数据因其数据量庞大、内容丰富、表达准确、专业权威而被选中作为知识库来源.详细讨论了专利数据的特性,挖掘不同专利间的知识关联,针对某一知识领域构造背景知识库,在此基础上进行目标文本的关键词自动抽取.与目标文本相关的专利文集中每个专利的专利发明人、权利人、专利引用和分类信息都被用于在不同的专利文档之间发现关联性,利用关联信息扩充背景知识库,获得目标文档在各个相关知识领域的背景知识库.基于背景知识库设计了词知识特征值,以反映词在目标文本背景知识中的重要程度.最后,把关键词抽取问题转化为分类问题,利用支持向量机(support vector machine,SVM)抽取出目标文本的关键词.在专利数据集和开放数据集的实验结果证明明显优于现有算法.

关 键 词:背景知识 关键词抽取 专利数据 支持向量机  信息检索

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心