期刊文章详细信息
文献类型:期刊文章
机构地区:[1]清华大学信息技术研究院,北京100084 [2]哈尔滨理工大学计算机科学与技术学院信息安全与智能技术研究中心,黑龙江哈尔滨150080 [3]哈尔滨理工大学外国语学院,黑龙江哈尔滨150080
基 金:国家自然科学基金(60903083);黑龙江省自然科学基金(F200936);教育部人文社科项目(11YJC740048)
年 份:2012
卷 号:17
期 号:2
起止页码:1-4
语 种:中文
收录情况:CAS、CSA、DOAJ、JST、RCCSE、ZGKJHX、普通刊
摘 要:为了改进传统的文本检索技术存在检索文件格式种类单一,索引大数据量文件速度慢,甚至造成内存溢出等问题,基于Lucene系统及相关技术,研究了基于合并因子的多种格式文件索引技术,并在此基础上构建了中文文本信息检索系统.实验分析表明,本系统有效地实现了多种格式文件检索功能,通过合并因子的设定有效提高了索引速度,系统可靠性高.
关 键 词:文本检索 合并因子 多种格式文件索引
分 类 号:TM391.3]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...