期刊文章详细信息

结合LDA与Word2vec的文本语义增强方法
Text Semantic Enhancement Method Combining LDA and Word2vec

文献类型：期刊文章

作　　者：唐焕玲[1,2,3] 卫红敏[4] 王育林[1] 朱辉[5] 窦全胜[1,2,3]

TANG Huanling;WEI Hongmin;WANG Yulin;ZHU Hui;DOU Quansheng(School of Computer Science and Technology,Shandong Technology and Business University,Yantai,Shandong 264005,China;Co-innovation Center of Shandong Colleges and Universities:Future Intelligent Computing,Yantai,Shandong 264005,China;Key Laboratory of Intelligent Information Processing in Universities of Shandong(Shandong Technology and Business University),Yantai,Shandong 264005,China;School of Information and Electronic Engineering,Shandong Technology and Business University,Yantai,Shandong 264005,China;Shanghai Conversation Intelligence Co.Ltd.,Shanghai 200120,China)

机构地区：[1]山东工商学院计算机科学与技术学院,山东烟台264005 [2]山东省高等学校协同创新中心:未来智能计算,山东烟台264005 [3]山东省高校智能信息处理重点实验室(山东工商学院),山东烟台264005 [4]山东工商学院信息与电子工程学院,山东烟台264005 [5]上海绘话智能科技有限公司,上海200120

出　　处：《计算机工程与应用》

基　　金：国家自然科学基金(61976124,61976125,62176140,61873177,61972235,82001775)。

年　　份：2022

卷　　号：58

期　　号：13

起止页码：135-145

语　　种：中文

收录情况：AJ、BDHX、BDHX2020、CSCD、CSCD_E2021_2022、IC、JST、RCCSE、ZGKJHX、核心刊

摘　　要：文本的语义表示是自然语言处理和机器学习领域的研究难点,针对目前文本表示中的语义缺失问题,基于LDA主题模型和Word2vec模型,提出一种新的文本语义增强方法Sem2vec(semantic to vector)模型。该模型利用LDA主题模型获得单词的主题分布,计算单词与其上下文词的主题相似度,作为主题语义信息融入到词向量中,代替one-hot向量输入至Sem2vec模型,在最大化对数似然目标函数约束下,训练Sem2vec模型的最优参数,最终输出增强的语义词向量表示,并进一步得到文本的语义增强表示。在不同数据集上的实验结果表明,相比其他经典模型,Sem2vec模型的语义词向量之间的语义相似度计算更为准确。另外,根据Sem2vec模型得到的文本语义向量,在多种文本分类算法上的分类结果,较其他经典模型可以提升0.58%~3.5%,同时也提升了时间性能。

关键词：LDA主题模型 Word2vec模型语义词向量语义相似度文本分类

分类号：TP181]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

重庆科技学院机构知识库

期刊文章详细信息

结合LDA与Word2vec的文本语义增强方法
Text Semantic Enhancement Method Combining LDA and Word2vec

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

重庆科技学院机构知识库

期刊文章详细信息

结合LDA与Word2vec的文本语义增强方法 Text Semantic Enhancement Method Combining LDA and Word2vec

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

结合LDA与Word2vec的文本语义增强方法
Text Semantic Enhancement Method Combining LDA and Word2vec