登录    注册    忘记密码

专利详细信息

一种基于多类别表格填充的情感三元组生成方法       

文献类型:专利

专利类型:发明专利

是否失效:

是否授权:

申 请 号:CN202210700536.9

申 请 日:20220620

发 明 人:葛继科 程文俊 向月 陈祖琴 武承志 胡庭恺 杨照旭 刘浩因 刘苏 陈超 胥纪超 余文成 董焱 郑育

申 请 人:重庆科技学院

申请人地址:401331 重庆市沙坪坝区大学城东路20号

公 开 日:20220923

公 开 号:CN115098675A

代 理 人:穆祥维

代理机构:重庆信航知识产权代理有限公司

语  种:中文

摘  要:本发明提供一种基于多类别表格填充的情感三元组生成方法,包括如下步骤:利用联合标注框架对原始评论文本的解析与评论文本的方面词、评论观点及情感极性统一标签;利用Bert预训练语言模型提取文本信息的语义特征;利用多类别多头注意力机制学习方面词与评论观点的关联类别增强向量表示;方面词识别与评论观点检测任务的信息分区及过滤;利用情感三元组统一标记空间实现单元格分数的填充及表格结构的对称性约束与隐含性约束;利用方面词、评价观点及情感极性在统一标注空间中均为矩形框的特性,进行统一标签搜索及结构化解码;构建多功能评论文本方面词情感三元组。本发明提升了方面词识别和评论观点检测的准确率以及消除了情感三元组重叠的问题。

主 权 项:1.一种基于多类别表格填充的情感三元组生成方法,其特征在于,包括以下步骤:S1、首先将爬虫工具所获得的评论文本信息数据进行清洗;其次对数据中的评论观点、评价对象即方面词以及情感类型进行统一标签,构建情感三元组统一标记空间;最后将标注好的数据以8:1:1的比例划分成训练集、验证集和测试集;S2、利用Bert预训练语言模型,对评论文本进行特征编码,从而抽取出文本的深层次语义信息H;S3、根据所述情感三元组统一标记空间,利用多类别多头注意力机制分别学习评论所属类别与方面词相关联的类别增强向量表示HA,以及与评论观点的关联类别增强向量表示HO;S4、以类别增强向量表示HA、HO为基础,利用分区过滤机制将方面词识别任务与评论观点检测任务进行双向关联,首先利用线性层神经网络实现类似LSTM神经网络的方面门和观点门然后利用门控机制将每个时间步单元分割成方面词识别任务分区ρA、评论观点检测任务分区ρO和共享任务分区ρS,最后利用过滤机制过滤与任务无关信息,得到分区过滤信息Hp;S5、利用双仿射深度注意力机制计算每个词对间的概率分布得分向量,并将概率分布得分向量填充到情感三元组统一标记空间二维表的每个词对单元格中;S6、向情感三元组统一标记空间二维表中的统一标签添加对称性约束Lsym和隐含性约束Limp;S7、利用情感三元组统一标记空间联合解码框架,遍历搜索二维表中�

关 键 词:三元组 评论文本  情感极性  评论  词识别  标注  统一  对称性约束  注意力机制  标记空间  标签搜索  表格结构  表格填充  关联类别  文本信息  向量表示 信息分区  语言模型  语义特征  原始评论  单元格 矩形框  隐含性 检测  准确率  构建  填充  过滤  解析  标签 多头  文本 化解  联合  学习  

IPC专利分类号:G06F16/35;G06F16/33;G06F40/30;G06N3/04

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心