期刊文章详细信息
基于动作空间扩充及奖励优化的知识图谱多跳推理
Multi-hop Knowledge Graph Reasoning with Action Space Augmentation and Reward Optimization
文献类型:期刊文章
WANG Liqin;SONG Jinsheng;DONG Yongfeng;LI Yingshuang(School of Artificial Intelligence and Data Science,Hebei University of Technology,Tianjin 300401,China;Hebei Key Laboratory of Big Data Computing,Tianjin 300401,China;Hebei Engineering Research Center of Data-Driven Industrial Intelligent,Tianjin 300401,China;Information Security and Technology Service Center,Hebei University of Technology,Tianjin 300401,China)
机构地区:[1]河北工业大学人工智能与数据科学学院,天津300401 [2]河北省大数据计算重点实验室,天津300401 [3]河北省数据驱动工业智能工程研究中心,天津300401 [4]河北工业大学信息安全与技术服务中心,天津300401
基 金:国家自然科学基金(61806072);河北省高等学校科学技术研究项目(ZD2022082;QN2021213);河北省自然科学基金(F2020202008)。
年 份:2023
卷 号:46
期 号:2
起止页码:283-292
语 种:中文
收录情况:BDHX、BDHX2020、CAS、JST、RCCSE、WOS、ZGKJHX、ZMATH、核心刊
摘 要:知识图谱的不完备性导致多跳推理在探索路径的过程中会缺失关键节点和关系,从而导致推理失败。针对此问题,文章提出了动作空间扩充及奖励优化模型AsaRo(Action Space Augmentation and Reward Optimization)。该模型根据实体的邻域信息寻找其相似实体,并利用相似实体的邻域信息扩充原实体动作空间。在模型优化方面,采用基于带有优势函数的演员评论家A2C(Advantage Actor Critic)算法的强化学习优化路径奖励,并在原有路径奖励的基础上添加状态价值函数以评价策略的好坏,进一步提升了模型效果。在知识图谱数据集UMLS、Kinship、WN18RR、NELL-995、FB15K-237上的实验结果表明,该文模型效果优于大部分现有模型。
关 键 词:知识图谱 多跳推理 强化学习 动作空间
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...