期刊文章详细信息
文献类型:期刊文章
机构地区:[1]北京邮电大学信息工程学院智能科学技术研究中心
基 金:国家863计划重大项目(2001AA114210)
年 份:2006
卷 号:23
期 号:12
起止页码:15-18
语 种:中文
收录情况:BDHX、BDHX2004、CSCD、CSCD_E2011_2012、JST、ZGKJHX、核心刊
摘 要:针对中文信息抽取系统中建立提取事件模板的难点问题,基于Bootstrapping思想,提出一种简单、可行的实体关系自动生成方法,利用由种子词和种子模板组成的知识库建立学习器,采用标量聚类的方法,通过种子模板抽取更多的与种子词相似语义关系的特征词。在此基础上,利用最近邻居的原则,进而生成更多的抽取模板。丰富了知识库,为分析二元实体关系奠定基础,使得生成复杂的消息模板成为可能,同时极大地减轻手工建立模板的复杂度,有利于系统进行移植。
关 键 词:BOOT Strapping 种子词 种子模板 标量聚类
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...