期刊文章详细信息
基于社交网络分析和LDA主题挖掘的短文本挖掘研究
Research on short text mining based on social network analysis and LDA topic mining
文献类型:期刊文章
WU Shuai;SHI Yi;YANG Xiuzhang;XIANG Meiyu(School of Information,Guizhou University of Finance and Economics,Guiyang 550025,China;Lianshui County High-level Talent Development Center,Huaian 223200,China;Guiyang Institute for Big Data and Finance,Guizhou University of Finance and Economics,Guiyang 550025,China)
机构地区:[1]贵州财经大学信息学院,贵州贵阳550025 [2]涟水县高层次人才发展中心,江苏淮安223200 [3]贵州财经大学贵阳大数据金融学院,贵州贵阳550025
基 金:贵州省科技计划项目(黔科合基础[2019]1041);贵州省科技计划项目(黔科合基础[2019]1403);贵州省科技计划项目(黔科合基础[2020]1Y279);贵州省科技计划项目(黔科合基础[2020]1Y420);贵州省教育厅青年科技人才成长项目(黔教合KY字[2016]175;黔教合KY字[2021]135);贵州财经大学2019年度校级项目(2019XQN01)。
年 份:2022
卷 号:45
期 号:20
起止页码:124-128
语 种:中文
收录情况:IC、JST、RCCSE、ZGKJHX、普通刊
摘 要:随着自媒体技术的不断发展,如何高效挖掘短文本数据信息已成为现阶段的研究重点。传统主题挖掘方法进行短文本数据分析时,仅考虑单位词出现频率进行判断,未考虑语义关联结构信息,分析效果欠佳。针对短文本数据的稀缺性,文中提出一种基于社交网络分析和LDA的主题挖掘分析模型。首先结合共词分析算法,分析不同文档间主题词的关系;然后结合社交网络分析算法,提高共词网络主题词耦合度;再借助隐含空间模型对共词网络进行降维,提高社交网络耦合性;最后结合隐含位置聚类算法发掘潜在社区,提高主题识别效果。实验结果表明,所提方法能够在一定程度上优化主题挖掘算法在识别短文本主题的效果,便于进行短文本研究,具有实用价值,也可为后续应用于前沿主题识别提供参考。
关 键 词:LDA主题挖掘 共词分析 社交网络分析 短文本挖掘 隐含空间模型 隐含位置聚类 主题识别 吉布斯抽样
分 类 号:TN911-34] TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...