期刊文章详细信息
面向结构化数据集的敏感属性识别与分级算法
Sensitive attribute recognition and classification algorithm for structure dataset
文献类型:期刊文章
He Wenzhu;Peng Changgen;Wang Maoni;Ding Xing;Fan Meimei;Ding Hongfa(College of Computer Science&Technology,Guizhou University,Guiyang 550025,China;State key Laboratory of Public Big Data,,Guizhou University,Guiyang 550025,China;College of Mathematics&Statistics,Guizhou University,Guiyang 550025,China;College of Information,Guizhou University of Finance&Economics,Guiyang 550025,China)
机构地区:[1]贵州大学计算机科学与技术学院,贵阳550025 [2]贵州大学公共大数据国家重点实验室,贵阳550025 [3]贵州大学数学与统计学院,贵阳550025 [4]贵州财经大学信息学院,贵阳550025
基 金:国家自然科学基金资助项目(U1836205,61662009,61772008,11761020);贵州省科技计划项目(黔科合重大专项字[2018]3001,黔科合重大专项字[2018]3007,黔科合重大专项字[2017]3002,黔科合支撑[2019]2004,黔科合支撑[2018]2162,黔科合基础[2019]1049,黔科合基础[2017]1045);贵州财经大学科研基金资助项目(2017XJC01)。
年 份:2020
卷 号:37
期 号:10
起止页码:3077-3082
语 种:中文
收录情况:AJ、BDHX、BDHX2017、CSCD、CSCD_E2019_2020、IC、JST、RCCSE、UPD、ZGKJHX、ZMATH、核心刊
摘 要:如何对生产环境中经代码混淆的结构化数据集的敏感属性(字段)进行自动化识别、分类分级,已成为对结构化数据隐私保护的瓶颈。提出一种面向结构化数据集的敏感属性自动化识别与分级算法,利用信息熵定义了属性敏感度,通过对敏感度聚类和属性间关联规则挖掘,将任意结构化数据集的敏感属性进行识别和敏感度量化;通过对敏感属性簇中属性间的互信息相关性和关联规则分析,对敏感属性进行分组并量化其平均敏感度,实现敏感属性的分类分级。实验表明,该算法可识别、分类、分级任意结构化数据集的敏感属性,效率和精确率更高;对比分析表明,该算法可同时实现敏感属性的识别与分级,无须预知属性特征、敏感特征字典,兼顾了属性间的相关性和关联关系。
关 键 词:隐私保护 敏感属性识别与分级 最大熵 关联规则 互信息
分 类 号:TP309]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...