期刊文章详细信息
文献类型:期刊文章
机构地区:[1]华中师范大学计算机科学系,湖北武汉430079 [2]国家语言资源监测与研究中心网络媒体语言分中心,湖北武汉430079
基 金:国家自然科学基金资助项目(60773167);湖北省自然科学基金资助项目(2006ABC011);973国家重点基础研究发展计划资助项目(2007CB310804);教育部/国家外国专家局高等学校学科创新引智计划资助项目(B07042);国家“十一五”科技支撑计划资助项目(2006BAK11B03)
年 份:2008
卷 号:22
期 号:6
起止页码:80-85
语 种:中文
收录情况:BDHX、BDHX2004、CSCD、CSCD2011_2012、JST、RCCSE、ZGKJHX、核心刊
摘 要:该文设计了一个热点事件发现系统。该系统面向互联网新闻报道流,能自动发现任意一段时间内网络上的热点事件,并给出描述事件发展过程的曲线图。针对网络新闻语料具有数据规模大和时间特征明显两个特性,系统将语料按时间(天)分组,对每天的语料采用凝聚聚类得到微类,选取某段时间内的所有微类,再做Single-pass聚类得到事件列表,利用事件热度计算公式,把候选事件按热度进行排序。采用该系统对2007年新闻语料进行实验,结果表明该系统能取得较好的效果。
关 键 词:计算机应用 中文信息处理 事件发现 凝聚聚类 Single-pass聚类 热度计算
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...