期刊文章详细信息
基于分层模型的缺失数据插补方法研究
Research on Comparison of Missing Data Imputation Methods Based on Multilevel Models
文献类型:期刊文章
Yu Lichao;Jin Yongjin
机构地区:[1]中央民族大学理学院统计学系 [2]中国人民大学应用统计科学研究中心 [3]中国人民大学统计学院 [4]湖北经济学院
基 金:国家社会科学基金青年项目“基于小域估计的民族地区贫困和不平衡发展程度测度研究”(18CTJ011);国家社会科学基金项目“大数据背景下非概率抽样的统计推断问题研究”(15BTJ014);全国统计科学研究重点项目“相依抽样调查数据模型的统计推断及在民族人口和教育领域的应用”(2017LZ01)的资助.
年 份:2018
卷 号:35
期 号:11
起止页码:93-104
语 种:中文
收录情况:BDHX、BDHX2017、CSSCI、CSSCI2017_2018、JST、NSSD、RCCSE、RWSKHX、SKJJZZ、ZGKJHX、核心刊
摘 要:大规模抽样调查多采用复杂抽样设计,得到具有分层嵌套结构的调查数据集,其中不可避免会遇到数据缺失问题,针对分层结构含缺失数据集的插补策略目前鲜有研究。本文将Gibbs算法应用到分层含缺失数据集的多重插补过程中,分别研究了固定效应模型插补法和随机效应模型插补法,进而通过理论推导和数值模拟,在不同组内相关系数、群组规模、数据缺失比例等情形下,从参数估计结果的无偏性和有效性两方面,比较不同方法的插补效果,给出插补模型的选择建议。研究结果表明,采用随机效应模型作为插补模型时,得到的参数估计结果更准确,而固定效应模型作为插补模型操作相对简便。在数据缺失比例较小、组内相关系数较大、群组规模较大等情形下,可以采用固定效应插补模型,否则建议采用随机效应插补模型。
关 键 词:分层结构数据 多重插补法 Gibbs算法 固定效应模型 随机效应模型
分 类 号:O212]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...