期刊文章详细信息
文献类型:期刊文章
机构地区:[1]哈尔滨工业大学语言语音教育部-微软重点实验室,黑龙江哈尔滨150001
基 金:国家自然科学基金资助项目(60736044);国家高技术研究发展计划("863"计划)资助项目(2006AA01Z150;2004AA11701008)~~
年 份:2007
卷 号:28
期 号:12
起止页码:156-160
语 种:中文
收录情况:BDHX、BDHX2004、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、EI(收录号:20080911124382)、IC、INSPEC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:为了找到一种自动将Blog网页区别于其他Web页面的方法,以便针对Blog语料进行内容抽取、对Blog社区进行规律性研究和发现等,针对Blog网页的特点与规律,提出一种根据网页结构和关键字计算相似度的方法识别Blog网页,初步的实验结果表明,达到了较高的识别正确率。
关 键 词:Blog网页识别 相似度计算 网页分类
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...