期刊文章详细信息
稳健高效的高维成分数据近似零值插补方法及应用
Robust Efficient Imputation of Rounded Zeros in High-dimensional Compositional Data and Its Applications
文献类型:期刊文章
Xiong Wei;Pan Han;Liu Lixin
机构地区:[1]对外经济贸易大学统计学院 [2]对外经济贸易大学统计学院数据科学系
基 金:教育部人文社科项目“基因与环境交互效应对复杂疾病的影响及稳健识别分析与应用”(16YJCZH22);对外经济贸易大学中央高校基本科研业务费专项资金(CXTD10-09)。
年 份:2020
卷 号:37
期 号:5
起止页码:104-116
语 种:中文
收录情况:BDHX、BDHX2017、CSSCI、CSSCI2019_2020、JST、NSSD、RCCSE、RWSKHX、SKJJZZ、ZGKJHX、核心刊
摘 要:随着计算机技术的迅猛发展,高维成分数据不断涌现并伴有大量近似零值和缺失,数据的高维特性不仅给传统统计方法带来了巨大的挑战,其厚尾特征、复杂的协方差结构也使得理论分析难上加难。于是如何对高维成分数据的近似零值进行稳健的插补,挖掘潜在的内蕴结构成为当今学者研究的焦点。对此,本文结合修正的EM算法,提出基于R型聚类的Lasso-分位回归插补法(SubLQR)对高维成分数据的近似零值问题予以解决。与现有高维近似零值插补方法相比,本文所提出的SubLQR具有如下优势。①稳健全面性:利用Lasso-分位回归方法,不仅可以有效地探测到响应变量的整个条件分布,还能提供更加真实的高维稀疏模式;②有效准确性:采用基于R型聚类的思想进行插补,可以降低计算复杂度,极大提高插补的精度。模拟研究证实,本文提出的SubLQR高效灵活准确,特别在零值、异常值较多的情形更具优势。最后将SubLQR方法应用于罕见病代谢组学研究中,进一步表明本文所提出的方法具有广泛的适用性。
关 键 词:高维成分数据 近似零值 Lasso-分位回归 修正EM算法 稳健
分 类 号:C81[统计学类]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...