期刊文章详细信息
面向热点话题时间序列的有效聚类算法研究 ( EI收录)
An Efficient and Effective Clustering Algorithm for Time Series of Hot Topics
文献类型:期刊文章
机构地区:[1]北京工商大学计算机与信息工程学院,北京100048 [2]东华大学计算机科学与技术学院,上海200051
基 金:国家自然科学基金(61170112);北京市属高等学校科学技术与研究生教育创新工程建设项目(PXM2012_014213_000037)资助~~
年 份:2012
卷 号:35
期 号:11
起止页码:2337-2347
语 种:中文
收录情况:BDHX、BDHX2011、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、EI(收录号:20124715691637)、IC、INSPEC、JST、MR、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:聚类热度时间序列是揭示和建模网络热点话题形成与发展的重要过程.Leskovec等人在2010年提出面向话题时间序列的K_SC聚类算法,其精确度较高且能较好地刻画话题内在发展趋势特征.但K_SC算法具有对初始类矩阵中心高度敏感、高时间复杂度等特性,使其难以在实际高维大数据集上应用.文中结合小波变换技术,提出一个新的迭代式聚类算法WKSC,主要提出两个创新:(1)用Haar小波变换将原始时间序列进行压缩,降低原始时间序列的维度,从而降低了算法的时间复杂度;(2)在Haar反小波变换中,将低维聚类返回得到的矩阵中心作为高维聚类的初始矩阵中心,在迭代聚类过程中优化了对初始矩阵中心高敏感性的问题,提高了聚类的效果.文中分别采用国内外3个数据集作为测试样本,进行了大量的实验.实验结果表明WKSC算法能显著降低聚类的时间复杂度,同时改进聚类效果.WKSC算法可很好的应用于大量高维热点话题的模式分析.
关 键 词:聚类 时间序列 热点话题 小波
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...