会议论文详细信息
文献类型:会议
作者单位:郑州大学信息工程学院计算机科学技术系,郑州450001
会议文献:2012中国计算机大会论文集
会议名称:2012中国计算机大会
会议日期:20120100
会议地点:大连
主办单位:中国计算机学会
出版日期:20120100
语 种:中文
摘 要:非共现数据是指不符合联合概率分布,而是符合一个未知函数的数据。将非共现数据转化为共现形式后可以采用熵来定量度量信息并进行聚类。但是,现有算法假设非共现数据的各个属性特征对聚类贡献均匀,没有考虑代表性属性和不相关(冗余)属性对聚类效果的不同影响。因此,本文提出一个非共现数据的两阶段加权IB算法(TSAW-sIB),在非共现数据共现转化的两个阶段,从”非共现/共现/联合”三个视角观察非共现数据,突出代表性属性,抑制冗余属性,获得更能准确反映非共现数据特征的数据表示并进行聚类。实验表明,TSAW-sIB算法优于ROCK、COOLCAT和LIMBO算法。
关 键 词:非共现数据 特征加权 两阶段 信息瓶颈方法 聚类
分 类 号:TP18]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...