登录    注册    忘记密码

期刊文章详细信息

稳健高效的高维成分数据近似零值插补方法及应用    

Robust Efficient Imputation of Rounded Zeros in High-dimensional Compositional Data and Its Applications

  

文献类型:期刊文章

作  者:熊巍[1,2] 潘晗[1] 刘立新[1]

Xiong Wei;Pan Han;Liu Lixin

机构地区:[1]对外经济贸易大学统计学院 [2]对外经济贸易大学统计学院数据科学系

出  处:《统计研究》

基  金:教育部人文社科项目“基因与环境交互效应对复杂疾病的影响及稳健识别分析与应用”(16YJCZH22);对外经济贸易大学中央高校基本科研业务费专项资金(CXTD10-09)。

年  份:2020

卷  号:37

期  号:5

起止页码:104-116

语  种:中文

收录情况:BDHX、BDHX2017、CSSCI、CSSCI2019_2020、JST、NSSD、RCCSE、RWSKHX、SKJJZZ、ZGKJHX、核心刊

摘  要:随着计算机技术的迅猛发展,高维成分数据不断涌现并伴有大量近似零值和缺失,数据的高维特性不仅给传统统计方法带来了巨大的挑战,其厚尾特征、复杂的协方差结构也使得理论分析难上加难。于是如何对高维成分数据的近似零值进行稳健的插补,挖掘潜在的内蕴结构成为当今学者研究的焦点。对此,本文结合修正的EM算法,提出基于R型聚类的Lasso-分位回归插补法(SubLQR)对高维成分数据的近似零值问题予以解决。与现有高维近似零值插补方法相比,本文所提出的SubLQR具有如下优势。①稳健全面性:利用Lasso-分位回归方法,不仅可以有效地探测到响应变量的整个条件分布,还能提供更加真实的高维稀疏模式;②有效准确性:采用基于R型聚类的思想进行插补,可以降低计算复杂度,极大提高插补的精度。模拟研究证实,本文提出的SubLQR高效灵活准确,特别在零值、异常值较多的情形更具优势。最后将SubLQR方法应用于罕见病代谢组学研究中,进一步表明本文所提出的方法具有广泛的适用性。

关 键 词:高维成分数据  近似零值  Lasso-分位回归  修正EM算法  稳健  

分 类 号:C81[统计学类]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心