登录    注册    忘记密码

期刊文章详细信息

基于辅助集的专利主题分析领域停用词选取    

Choosing Stopwords for Patent Topic Analysis Based on Auxiliary Set

  

文献类型:期刊文章

作  者:俞琰[1,2] 赵乃瑄[1]

Yu Yan;Zhao Naixuan(Information Service Department,Nanjing Tech University,Nanjing 210009,China;Department of Computer Engineering,Southeast University Chcngxian College,Nanjing 211816,China)

机构地区:[1]南京工业大学信息服务部,南京210009 [2]东南大学成贤学院计算机工程系,南京211816

出  处:《数据分析与知识发现》

基  金:国家社会科学基金项目"大数据时代支持创新设计的多维度多层次专利文本挖掘研究"(项目编号:17BTQ059)的研究成果之一

年  份:2018

卷  号:2

期  号:11

起止页码:95-103

语  种:中文

收录情况:BDHX、BDHX2017、CSCD、CSCD2017_2018、CSSCI、CSSCI2017_2018、NSSD、RCCSE、RWSKHX、ZGKJHX、核心刊

摘  要:[目的]提出一种领域停用词自动选取方法,以提高专利主题分析的区分度和质量。[方法]针对要进行专利主题分析的目标集,引入专利辅助集,提出基于辅助集文档频率和类别熵两个指标,衡量词语在辅助集中分布情况,自动识别领域停用词。[结果]实验结果表明,基于辅助集的领域停用词选取方法能够提高专利主题分析的区分度和质量。[局限]辅助集的选取类型和数量有待进一步研究。[结论]基于辅助集的领域停用词选取方法能够有效地衡量词的分布特征,从而更准确地选取专利主题分析中的领域停用词。

关 键 词:专利主题分析  领域停用词  辅助集  

分 类 号:G250[图书情报与档案管理类]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心