登录    注册    忘记密码

期刊文章详细信息

Blog网页分类与识别技术研究  ( EI收录)  

Study on the classification and identification of Blog pages

  

文献类型:期刊文章

作  者:郑德权[1] 张迪[1] 赵铁军[1] 于浩[1]

机构地区:[1]哈尔滨工业大学语言语音教育部-微软重点实验室,黑龙江哈尔滨150001

出  处:《通信学报》

基  金:国家自然科学基金资助项目(60736044);国家高技术研究发展计划("863"计划)资助项目(2006AA01Z150;2004AA11701008)~~

年  份:2007

卷  号:28

期  号:12

起止页码:156-160

语  种:中文

收录情况:BDHX、BDHX2004、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、EI(收录号:20080911124382)、IC、INSPEC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊

摘  要:为了找到一种自动将Blog网页区别于其他Web页面的方法,以便针对Blog语料进行内容抽取、对Blog社区进行规律性研究和发现等,针对Blog网页的特点与规律,提出一种根据网页结构和关键字计算相似度的方法识别Blog网页,初步的实验结果表明,达到了较高的识别正确率。

关 键 词:Blog网页识别  相似度计算 网页分类

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心