登录    注册    忘记密码

期刊文章详细信息

Web新闻语料分词和标注错误分析    

Analysis of inaccurate style in processing Web true news text--about word segmentation and part of speech tagging

  

文献类型:期刊文章

作  者:张永奎[1,2] 张彦[1,2] 安增波[3] 刘睿[1,2]

机构地区:[1]山西大学计算机与信息技术学院 [2]计算智能与中文信息处理省部共建教育部重点实验室,太原030006 [3]中国人民解放军91708部队自动化工作站

出  处:《计算机工程与应用》

基  金:国家自然科学基金(the National Natural Science Foundation of China under Grant No.60475022) ;山西省自然科学基金(the Natural Science Foundation of Shanxi Province of China under Grant No.20041041);山西省回国留学人员基金(No.2002004)。

年  份:2007

卷  号:43

期  号:15

起止页码:166-169

语  种:中文

收录情况:AJ、BDHX、BDHX2004、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、IC、INSPEC、JST、RCCSE、ZGKJHX、核心刊

摘  要:通过分析Web突发事件语料库文本的加工统计得出11类错误类型,并对其中的一些错误提出了解决方案。研究结果不仅对语料库加工初期分词、标注方法的改进有启发作用,而且对中文的自动校对方法,提供一定的借鉴。

关 键 词:中文信息处理 分词 词性标注 错误类型  Web突发事件新闻语料库  

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心