期刊文章详细信息
文献类型:期刊文章
机构地区:[1]武汉大学计算机学院,武汉430072 [2]乐山师范学院计算机科学学院,四川乐山614000 [3]武汉大学软件工程国家重点实验室,武汉430072
基 金:国家自然科学基金(61133012;61373108;61373056);国家社科重大招标计划项目(11&ZD189)资助~~
年 份:2017
卷 号:40
期 号:4
起止页码:791-804
语 种:中文
收录情况:BDHX、BDHX2014、CSA、CSA-PROQEUST、CSCD、CSCD2017_2018、EI(收录号:20172703889284)、IC、JST、MR、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:主题模型已被广泛用于发现文档潜在主题.已有方法多采用词或短语来表示主题,然而这些方法生成的主题缺乏深层次的语义信息,可解释性比较差.文中提出使用结构化的事件来表示主题.一方面,事件包含比词或短语更丰富的语义;另一方面,一组相关的事件能更合理地解释并区分不同的主题.为解决事件作为基本单元所带来的稀疏性问题,该文在Biterm Topic Model(BTM)的基础上提出两种主题模型,采用两种不同的方式将事件的语义知识融入到主题生成过程中.其中,第1种模型利用Generalized Pólya Urn(GPU)模型天然的聚类效果加大语义相近的事件分配到同一主题的概率,而第2种模型则通过为每个biterm引入指示变量,合理地利用语义知识有效地解决同一个biterm中两个事件的主题分配问题.该文不仅从主题凝聚度和KL散度两个指标直接对主题模型进行评估,还通过将主题表示结果引入到文本分类任务中对模型进行了外部评估.实验结果表明文中提出的模型从共现和语义两个层面有效地解决了事件稀疏性问题.与基于词或短语的主题表示相比,事件结构所包含的语义信息提高了主题生成质量,使主题表示具有更强的可读性和主题判别性.
关 键 词:事件 主题模型 主题表示 事件知识 自然语言处理 社交网络 社会媒体
分 类 号:TP18]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...