登录    注册    忘记密码

期刊文章详细信息

控制混杂因素的基于随机森林方法评价    

Evaluation of Random Forest based Methods for Controlling Confounding Factors

  

文献类型:期刊文章

作  者:梁君雅[1,2] 赵杨[2] 段巍巍[2,3] 何杰宇[2,4] 魏永越[2] 陈峰[2]

Liang Junya;Zhao Yang;Duan Weiwei(Institute of Hypertension,Jiangsu Provincial Hospital of Traditional Chinese Medicine,Nanjing 210000,China)

机构地区:[1]江苏省中医院,南京市中医药大学附属医院,210000 [2]南京医科大学公共卫生学院生物统计学系 [3]南京医科大学生物医学工程与信息学院生物信息学系 [4]昆明医科大学公共卫生学院

出  处:《中国卫生统计》

基  金:国家重点研发计划“战略性国际科技创新合作”重点专项项目(2016YFE0204900);国家自然科学基金项目(81973142);江苏省中医院院级创新发展基金专项课题(Y2019CX15)。

年  份:2022

卷  号:39

期  号:6

起止页码:844-849

语  种:中文

收录情况:BDHX、BDHX2020、CSCD、CSCD2021_2022、JST、RCCSE、ZGKJHX、核心刊

摘  要:目的在高维组学研究中,混杂因素常常影响着随机森林筛选出与研究结局相关联的变量的能力,因此控制混杂因素具有非常重要的作用。方法通过模拟试验和实例验证,我们比较了以下四种方法在筛选与研究结局相关联的变量中控制混杂因素的效果:随机森林(random forest,RF);Ranger法;加权Ranger,给予每个混杂因素以100%的权重;残差法,将去除混杂因素的因变量和自变量作为新的因变量和自变量纳入Ranger分析。研究采用危险因素在重要性评分排序中排在第一位的比例作为评价指标。结果基于大量的模拟试验,我们发现残差法和加权Ranger法有效提高了危险因素在重要性评分排序中排在第一位的比例。GWAS实例证实,在使用这两种方法校正混杂因素之后,危险因素的排序有所提前。结论校正混杂因素对于筛选与研究结局相关联的变量十分必要,且残差法在混杂因素校正上表现优于加权Ranger法,RF和Ranger几乎无混杂校正作用。

关 键 词:混杂  随机森林  RANGER 加权 重要性评分  

分 类 号:R195.1]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心