登录    注册    忘记密码

期刊文章详细信息

一种基于双数组Trie的B2B规则串提取方法    

Rules String Extracting Method for B2B System Based on Double-array Trie

  

文献类型:期刊文章

作  者:李慧[1] 杨炳儒[1] 潘丽芳[1] 钱文彬[1]

机构地区:[1]北京科技大学计算机与通信工程学院知识工程研究所,北京100083

出  处:《计算机科学》

基  金:国家自然科学基金项目(61175048;60875029);科技部创新方法工作专项项目(2010IM020900)资助

年  份:2013

卷  号:40

期  号:5

起止页码:206-208

语  种:中文

收录情况:BDHX、BDHX2011、CSA、CSCD、CSCD2013_2014、IC、JST、RCCSE、UPD、ZGKJHX、核心刊

摘  要:针对B2B垂直搜索引擎中提取产品规格信息困难的问题,提出了一种基于双数组Trie(Double-Array Trie)的规则串提取方法。该方法针对B2B系统中"参数名:参数值"字符串的规则特征构建规则串,生成双数组Trie树;并优先处理分支结点最多的子树,来提高存储效率。该方法对搜索文本进行一次扫描就能得到所有规则串;通过在规则中加入约束条件,对候选串进行有效过滤,以提高规则串的提取准确率。实验表明,该方法能够降低传统规则串查找的算法复杂度,查找规则串的时间复杂度是O(n)。

关 键 词:双数组Trie  垂直搜索 规则串  B2B系统  

分 类 号:TP311.12]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心