登录    注册    忘记密码

期刊文章详细信息

博客语料的新词发现方法    

Discovery method of new words in blog contents

  

文献类型:期刊文章

作  者:黄轩[1,2] 李熔烽[2]

机构地区:[1]厦门大学智能科学与技术系,福建厦门361005 [2]漳州职业技术学院经济管理系,福建漳州363000

出  处:《现代电子技术》

基  金:漳州职业技术学院科研计划资助项目(ZZY1107)

年  份:2013

卷  号:36

期  号:2

起止页码:144-146

语  种:中文

收录情况:IC、RCCSE、ZGKJHX、普通刊

摘  要:新词发现一直是自然语言处理的热点问题和难点问题之一,为了提取博客语料的新词,首先对语料进行文中分词,然后根据新词的定义及新词的"时空"性质,在词串统计的基础上,通过词出现的频率,词分布的密度,上下文分析以及词在时间域上的变化分析对词进行过滤;最后通过词的统计信息和词性规则对候选词进行排序以提高准确率;在此基础上建立新词发现系统。

关 键 词:新词 词串统计  上下文分析 分词 候选词  

分 类 号:TN911.34]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心