期刊文章详细信息
文献类型:期刊文章
机构地区:[1]北京科技大学计算机与通信工程学院知识工程研究所,北京100083
基 金:国家自然科学基金项目(61175048;60875029);科技部创新方法工作专项项目(2010IM020900)资助
年 份:2013
卷 号:40
期 号:5
起止页码:206-208
语 种:中文
收录情况:BDHX、BDHX2011、CSA、CSCD、CSCD2013_2014、IC、JST、RCCSE、UPD、ZGKJHX、核心刊
摘 要:针对B2B垂直搜索引擎中提取产品规格信息困难的问题,提出了一种基于双数组Trie(Double-Array Trie)的规则串提取方法。该方法针对B2B系统中"参数名:参数值"字符串的规则特征构建规则串,生成双数组Trie树;并优先处理分支结点最多的子树,来提高存储效率。该方法对搜索文本进行一次扫描就能得到所有规则串;通过在规则中加入约束条件,对候选串进行有效过滤,以提高规则串的提取准确率。实验表明,该方法能够降低传统规则串查找的算法复杂度,查找规则串的时间复杂度是O(n)。
关 键 词:双数组Trie 垂直搜索 规则串 B2B系统
分 类 号:TP311.12]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...