登录    注册    忘记密码

期刊文章详细信息

信息检索用户查询语句的停用词过滤    

Removal of Stop Word in Users’ Request for Information Retrieval

  

文献类型:期刊文章

作  者:熊文新[1] 宋柔[2]

机构地区:[1]北京外国语大学中国外语教育研究中心,北京100089 [2]北京语言大学语言信息处理研究所,北京100083

出  处:《计算机工程》

基  金:国家自然科学基金资助项目(60272055);国家"863"计划基金资助项目(2001AA114111);教育部科学技术研究资助重点项目(00128);教育部人文社会科学重点研究基地资助重大项目(02JAZJD740007)

年  份:2007

卷  号:33

期  号:6

起止页码:195-197

语  种:中文

收录情况:AJ、BDHX、BDHX2004、CAS、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、IC、INSPEC、JST、RCCSE、SCOPUS、UPD、ZGKJHX、核心刊

摘  要:针对以自然语言形式提出的查询请求,区分信息需求表述和信息内容两部分。基于近20万语句的查询语料库和背景语料人民日报对照,提出汉语通用停用词和查询专用的相对停用词,采用左右熵和Ngram方法及KL距离脱机构造相应候选词表。根据候选词语的Bigram属性和句中不同位置的分布特点,给出了在线动态识别停用词的方法。实验结果表明,该文的方法比单纯根据静态停用词表标注效果要好。

关 键 词:用户查询 停用词 构造  识别  

分 类 号:TP311]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心