期刊文章详细信息
文献类型:期刊文章
机构地区:[1]北京邮电大学智能研究中心,北京100876
基 金:国家自然科学基金资助资助项目为:面向智能的信息理论及应用项目编号 :6 9982 0 0 1
年 份:2002
卷 号:21
期 号:1
起止页码:12-16
语 种:中文
收录情况:AJ、BDHX、BDHX2000、CSA、CSA-PROQEUST、CSSCI、CSSCI2000_2002、INSPEC、JST、NSSD、RCCSE、RWSKHX、ZGKJHX、核心刊
摘 要:常用词搭配 (collocation)是指一些常用的用来表达某些事情或事物的短语 ,一般是二元组或三元组等。常用词搭配的自动发现在自然语言处理中起着很重要的作用 ,它能够丰富词典的容量 ,提高系统的性能。本文提出 4种判断一个二元组是否是常用词搭配的方法 ,并对各种方法的结果进行了比较。然后在已知二元组的基础上 ,提出了统计和发现三元或多元组的方法。这种利用二元组来构造三元组的方法 ,比统计所有三元组的计算量大大减少。
关 键 词:常用词搭配 二元组 自然语言处理 互信息 最大可能比 自动发现 三元组 多元组
分 类 号:G350]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...