期刊文章详细信息
基于LCS的特征树最大相似性匹配网页去噪算法
Maximum Similarity Matching Algorithm for Noise Reduction in Web Pages Based on LCS
文献类型:期刊文章
机构地区:[1]上海交通大学电子工程系图像通信与信息处理研究所,上海200240 [2]上海交通大学上海市数字媒体处理与传输重点实验室,上海200240 [3]上海文广互动电视有限公司,上海200072
基 金:国家"863"计划项目(2008BAH28B04);上海市科委资助项目(08dz1500108);中国博士后科学基金;上海市博士后基金资助项目(20090460637;10R21414800)
年 份:2011
卷 号:35
期 号:13
起止页码:44-48
语 种:中文
收录情况:BDHX、BDHX2008、CSA、CSA-PROQEUST、INSPEC、核心刊
摘 要:提出了一种基于LCS的特征树最大相似性匹配网页去噪算法。通过将目标网页和相似网页转化为特征树,并将特征树映射为一个特征节点序列,利用LCS算法能获得最长子序列全局最优解的特点,找出两棵特征树之间的不同节点作为候选集,并对候选集进行聚集评分找出网页重要内容块。给出了算法的原型系统,并对每一个模块的实现做了详尽的描述。
关 键 词:LCS 特征树 网页去噪
分 类 号:TP393.09]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...