期刊文章详细信息
文献类型:期刊文章
机构地区:[1]哈尔滨理工大学软件学院,黑龙江哈尔滨150040 [2]黑龙江工程学院计算机科学与技术学院,黑龙江哈尔滨150050
基 金:黑龙江省教育厅2014年度科学技术研究面上项目(12541124)
年 份:2017
卷 号:22
期 号:2
起止页码:112-116
语 种:中文
收录情况:BDHX、BDHX2014、CAS、DOAJ、JST、RCCSE、ZGKJHX、核心刊
摘 要:针对微阵列表达数据集中基因-基因之间存在复杂相关关系的问题,基于随机森林变量重要性分数,提出了一种新的加权K-均值基因聚类算法。首先,以微阵列表达数据中的样本为对象、基因为特征,训练随机森林分类器,计算每个基因的变量重要性分数;然后,以基因为对象、样本为特征、基因的变量重要性分数为权重进行K-均值聚类。在Leukemia、Breast、DLBCL等3个微阵列表数据集上进行了实验,结果表明:所提出的加权K-均值聚类算法与原始的K-均值聚类算法相比,类间距离与总距离的比值平均高出17.7个百分点,具有更好的同质性和差异性。
关 键 词:微阵列表达数据 聚类分析 随机森林 K-均值
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...