专利详细信息
文献类型:专利
专利类型:发明专利
是否失效:否
是否授权:否
申 请 号:CN202210009599.X
申 请 日:20220105
申 请 人:华能贵诚信托有限公司
申请人地址:550081 贵州省贵阳市观山湖区长岭北路55号贵州金融城一期商务区10号楼23、24层
公 开 日:20220823
公 开 号:CN114936559A
代 理 人:张帆
代理机构:北京正理专利代理有限公司
语 种:中文
摘 要:本发明公开了一种基于多模型融合的多级事件抽取方法、抽取系统、计算机设备和存储介质,其中一实施例的多级事件抽取方法包括:使用筛选模型分别对输入的多个待抽取文本按照段落进行语义提取、拼接并分类以输出对应的第一事件结果;根据各待抽取文本的第一事件结果将多个待抽取文本分别输入对应的深度事件模型,每个深度事件模型对输入的待抽取文本进行事件抽取并输出待抽取文本的第二事件结果;使用融合单元对各深度事件模型输出的各多个待抽取文本的第二事件结果进行融合并生成第三事件结果。本发明提供的实施例能够根据预建立的事件类型体系快速识别非结构化文档中的事件类型和事件元素,有效提高事件抽取的抽取效率,具有实际应用价值。
主 权 项:1.一种基于多模型融合的多级事件抽取方法,其特征在于,包括:S1:使用筛选模型分别对输入的多个待抽取文本按照段落进行语义提取,对每个待抽取文本的各段落所提取的语义特征进行拼接并分类以输出对应的第一事件结果;S2:根据各待抽取文本的第一事件结果将所述多个待抽取文本分别输入对应的深度事件模型,每个深度事件模型对输入的待抽取文本进行事件抽取并输出所述待抽取文本的第二事件结果,每个深度事件模型包括用于事件抽取的至少一个事件子模型、以及用于汇集各事件子模型输出的第二事件结果的汇集单元,不同的深度事件模型对应不同的事件类型体系;S3:使用融合单元对各深度事件模型输出的各所述多个待抽取文本的第二事件结果进行融合并生成第三事件结果,所述第三事件结果包括第三事件类型和对应的第三事件元素。
关 键 词:抽取 事件结果 文本 事件模型 事件类型 输出 非结构化文档 计算机设备 抽取系统 存储介质 快速识别 模型融合 筛选模型 事件元素 语义提取 融合 拼接 分类 应用
IPC专利分类号:G06F40/30;G06F40/295;G06F16/35;G06N3/04
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...