期刊文章详细信息
文献类型:期刊文章
机构地区:[1]新疆大学计算机科学与技术博士后流动站,乌鲁木齐830054 [2]新疆师范大学网络信息安全与舆情分析实验室,乌鲁木齐830054
基 金:国家自然科学基金资助项目(61163064);新疆师范大学网络信息安全与舆情分析实验室公开招标课题基金资助项目(WLYQ2012110);新疆师范大学研究生科技创新基金资助项目(20131204)
年 份:2015
卷 号:41
期 号:4
起止页码:187-189
语 种:中文
收录情况:AJ、BDHX、BDHX2014、CAS、CSA、CSA-PROQEUST、CSCD、CSCD_E2015_2016、IC、INSPEC、JST、RCCSE、SCOPUS、UPD、ZGKJHX、核心刊
摘 要:为提高维吾尔文网络内容查询的扩展性能,提出一种将维语同义词和互联网资源相结合的扩展词构建算法。利用维吾尔语同义词词典、近义词词典和反义词词典等建立基本候选词库,将互联网作为超大规模语料库,以搜索引擎为工具,使用改进的点互信息对基本扩展词进行相似度评价,选取前N个词形成候选扩展词库1,对包含关键词的互联网语料,基于局部共现和点互信息分析,构建候选扩展词库2,对上述2种候选扩展词库加权求和,按顺序选择部分词为扩展词。通过搜索引擎实现扩展查询验证,结果表明,与常规查询和同义词查询扩展算法相比,该算法能明显提高查询的准确率。
关 键 词:查询扩展 局部共现分析 点互信息算法 扩展词 大规模语料库
分 类 号:TP399]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...