期刊文章详细信息
文献类型:期刊文章
机构地区:[1]河南工业大学粮食信息处理与控制教育部重点实验室,河南郑州450001 [2]数字出版技术国家重点实验室,北京100871
基 金:CCF-数字出版技术国家重点实验室开放基金项目(CCF2012-02-02)资助;河南省基础与前沿技术研究项目(112300410007)资助;河南工业大学高层次人才基金项目(2012BS027)资助
年 份:2012
卷 号:33
期 号:12
起止页码:2738-2743
语 种:中文
收录情况:AJ、BDHX、BDHX2011、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、IC、INSPEC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:针对目前科学技术文献数量激增、难以从总体上分析把握的现状,提出一种从科技文献中获得研究主题特征词并展现其演化趋势的方法.该方法先利用LDA(Latent Dirichlet Allocation)模型对不同时间片内的话题进行自动抽取,得到不同数量的话题.然后,通过话题过滤剔除意义有限的话题,并借助简单启发式规则选择种子话题.最后,再利用语义相关度将相邻时间片内内容相近的种子话题联系起来,以得到研究主题的演化趋势.实验结果表明,在不对话题生成进行人工干预的前提下,本文方法较真实地描述了研究主题强度和内容随时间的演化趋势,避免了无意义话题对研究主题演化的负面影响.
关 键 词:LDA模型 主题演化 种子话题 话题过滤 加权线性组合
分 类 号:TP18]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...