期刊文章详细信息
文献类型:期刊文章
机构地区:[1]厦门大学智能科学与技术系,福建厦门361005 [2]漳州职业技术学院经济管理系,福建漳州363000
基 金:漳州职业技术学院科研计划资助项目(ZZY1107)
年 份:2013
卷 号:36
期 号:2
起止页码:144-146
语 种:中文
收录情况:IC、RCCSE、ZGKJHX、普通刊
摘 要:新词发现一直是自然语言处理的热点问题和难点问题之一,为了提取博客语料的新词,首先对语料进行文中分词,然后根据新词的定义及新词的"时空"性质,在词串统计的基础上,通过词出现的频率,词分布的密度,上下文分析以及词在时间域上的变化分析对词进行过滤;最后通过词的统计信息和词性规则对候选词进行排序以提高准确率;在此基础上建立新词发现系统。
关 键 词:新词 词串统计 上下文分析 分词 候选词
分 类 号:TN911.34]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...