期刊文章详细信息
文献类型:期刊文章
机构地区:[1]北京信息科技大学,北京100101 [2]北京拓尔思信息技术股份有限公司,北京100101
基 金:国家863计划重点资助项目(2006AA010105);国家自然科学基金资助项目(60772081);北京市教委科技发展计划资助项目(KM200910772022)
年 份:2011
卷 号:25
期 号:1
起止页码:48-53
语 种:中文
收录情况:BDHX、BDHX2008、CSCD、CSCD2011_2012、JST、RCCSE、ZGKJHX、核心刊
摘 要:热词是一种网络词汇现象,反映了某一特定时空范围内人们普遍关注的问题。该文对热词分析的两项关键技术——热词发现和热词关联技术进行了深入的研究。在热词发现阶段,首先采用命名实体识别技术和高频串统计技术进行短语串的挖掘,继而采用基础权值和波动权值两项指标进行热度权值的计算。在热词关联阶段,按热词权值高低进行热词类的划分,通过同现率的原则确定热词类之间的关联计算。该文所采用的方法已经成功应用到TRS舆情监测系统的热点发现模块。
关 键 词:热词 命名实体识别 热度计算 波动权值 词群关系
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...