期刊文章详细信息
文献类型:期刊文章
Yang Guijun;Xu Xue;Zhao Fuqiang(China Center of Economics and Statistics Research,Tianjin University of Finance and Economics,Tianjin 300222,China;Institute of Polytechnic,Tianjin University of Finance and Economics,Tianjin 300222,China)
机构地区:[1]天津财经大学中国经济统计研究中心,天津300222 [2]天津财经大学理工学院,天津300222
基 金:国家自然科学基金面上项目"劣者淘汰两阶段自适应临床试验的设计和分析"(项目编号:11471239);国家社会科学基金青年项目"社交媒体中敏感信息可信度评估方法研究"(项目编号:18CTJ008);全国统计科研计划重点项目"Web社会网络中敏感信息识别及突发事件预测研究"(项目编号:2017LZ05)的研究成果之一
年 份:2019
卷 号:3
期 号:1
起止页码:118-126
语 种:中文
收录情况:BDHX、BDHX2017、CSCD、CSCD_E2019_2020、CSSCI、CSSCI2019_2020、NSSD、RCCSE、RWSKHX、ZGKJHX、核心刊
摘 要:【目的】基于用户网络评论构建有效的评分预测模型,挖掘用户消费行为特征。【方法】基于LDA模型,量化用户评论为主题特征向量作为解释变量,将用户评分作为被解释变量,采用XGBoost算法,并加入样本扰动和属性扰动生成多个模型进行集成,构建用户评分预测模型。【结果】针对某汽车门户网站的用户评论评分预测结果表明,该模型较好地揭示了用户对汽车商品的偏好。较逻辑回归、随机森林算法,其预测准确度分别高出13.73%、0.64%,且具有较高的计算效率。【局限】未融合其他方面的数据对用户行为特征进行更全面的刻画。【结论】将用户评论量化为主题特征向量,基于XGBoost算法能够准确、高效地预测用户评分。
关 键 词:评分预测 XGBoost算法 LDA主题模型 文本特征提取 用户评论
分 类 号:TP391.1]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...