登录    注册    忘记密码

期刊文章详细信息

基于聚类和Spark框架的加权Slope One算法    

Weighted Slope One algorithm based on clustering and Spark framework

  

文献类型:期刊文章

作  者:李淋淋[1] 倪建成[2] 于苹苹[1] 姚彬修[1] 曹博[1]

LI Linlin NI Jiancheng YU Pingping YAO Binxiu CAO Bo(College of lnformation Science and Engineering, Qufu Normal University, Rizhao Shandong 276826, China College of Software Engineering, Qafu Normal University, Qafu Shandong 273165, China)

机构地区:[1]曲阜师范大学信息科学与工程学院,山东日照276826 [2]曲阜师范大学软件学院,山东曲阜273165

出  处:《计算机应用》

基  金:国家自然科学基金青年基金资助项目(61402258);山东省本科高校教学改革研究项目(2015M102);校级教学改革研究项目(jg05021*)~~

年  份:2017

卷  号:37

期  号:5

起止页码:1287-1291

语  种:中文

收录情况:AJ、BDHX、BDHX2014、CSCD、CSCD_E2017_2018、IC、JST、RCCSE、ZGKJHX、ZMATH、核心刊

摘  要:针对传统Slope One算法在相似性计算时未考虑项目属性信息和时间因素对项目相似性计算的影响,以及推荐在当前大数据背景下面临的计算复杂度高、处理速度慢的问题,提出了一种基于聚类和Spark框架的加权Slope One算法。首先,将时间权重加入到传统的项目评分相似性计算中,并引入项目属性相似性生成项目综合相似度;然后,结合Canopy-K-means聚类算法生成最近邻居集;最后,利用Spark计算框架对数据进行分区迭代计算,实现该算法的并行化。实验结果表明,基于Spark框架的改进算法与传统Slope One算法、基于用户相似性的加权Slope One算法相比,评分预测准确性更高,较Hadoop平台下的运行效率平均可提高3.5~5倍,更适合应用于大规模数据集的推荐。

关 键 词:SLOPE One算法  聚类 SPARK 时间权重  项目属性  

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心