期刊文章详细信息
基于Single-Pass的网络舆情热点发现算法 ( EI收录)
An Internet Public Opinion Hotspot Detection Algorithm Based on Single-Pass
文献类型:期刊文章
机构地区:[1]西藏大学藏文信息技术研究中心,拉萨850000 [2]西南交通大学信息科学与技术学院,成都610031 [3]西南交通大学生命科学与工程学院,成都610031 [4]电子科技大学大数据研究中心,成都611731 [5]广西师范学院科学计算与智能信息处理广西高校重点实验室,南宁530023
基 金:国家自然科学基金(61100045;61165013);高等学校博士学科点专项科研基金(20110184120008);中国博士后科学基金特别资助项目(201104697);教育部人文社会科学研究青年基金(14YJCZH046);中央高校基本科研业务费专项资金(2682013BR023);科学计算与智能信息处理广西高校重点实验室开放课题资助(GXSCIIP201407);四川省教育厅资助科研项目(14ZB0458)
年 份:2015
卷 号:44
期 号:4
起止页码:599-604
语 种:中文
收录情况:BDHX、BDHX2014、CAS、CSA、CSA-PROQEUST、CSCD、CSCD2015_2016、EI、IC、INSPEC、JST、MR、RCCSE、SCOPUS、ZGKJHX、ZMATH、核心刊
摘 要:考虑网络事件的时间距离,基于半结构化网页中不同位置特征项重要程度的不同,提出改进的single-pass文本聚类算法single-pass*,优势在于对Web文本不同位置特征项的加权处理,仅需计算新文档与同类别种子文档间的相似度。实验结果表明,相比single-pass,改进算法极大减少了漏检率和错检率,降低了由于新文本流内文档进行相似度计算导致系统性能的下降,平均提高Web文本聚类效率40%。将聚类后的Web文本应用于网络舆情分析,进行主题关注度分析和话题热度特性分析。
关 键 词:舆情分析 single-pass 文本聚类 话题发现
分 类 号:TP312]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...