期刊文章详细信息
文献类型:期刊文章
机构地区:[1]复旦大学计算机科学技术学院上海市数据科学重点实验室,上海201203
基 金:国家自然科学基金(91546105;71331005);国家高技术研究发展计划项目(2015AA020105);上海市科委项目(16JC1400801;16511102204);NSFC-广东联合基金(第二期)超级计算科学应用研究专项;国家超级计算广州中心支持项目
年 份:2018
卷 号:44
期 号:3
起止页码:55-59
语 种:中文
收录情况:AJ、BDHX、BDHX2017、CAS、CSA、CSA-PROQEUST、CSCD、CSCD_E2017_2018、IC、INSPEC、JST、RCCSE、SCOPUS、UPD、ZGKJHX、核心刊
摘 要:目前的多数故事线挖掘研究侧重新闻文献和事件的相似性分析,忽略了故事线的结构化表述及新闻具有的延时性,无法直观地从模型结果看出不同新闻话题的发展过程。为此,提出一种基于贝叶斯网络的无监督故事线挖掘算法。将故事线看成日期、时间、机构、人物、地点、主题和关键词的联合概率分布,并考虑新闻时效性。在多个新闻数据集上进行的实验和评估结果表明,与K-means、LSA等算法相比,该算法模型具有较高的故事线挖掘能力。
关 键 词:故事线挖掘 事件 贝叶斯网络 时效性 新闻 主题
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...