登录    注册    忘记密码

期刊文章详细信息

面向结构化数据集的敏感属性识别与分级算法    

Sensitive attribute recognition and classification algorithm for structure dataset

  

文献类型:期刊文章

作  者:何文竹[1,2] 彭长根[1,2] 王毛妮[1,2] 丁兴[1,2] 樊玫玫[3] 丁红发[4]

He Wenzhu;Peng Changgen;Wang Maoni;Ding Xing;Fan Meimei;Ding Hongfa(College of Computer Science&Technology,Guizhou University,Guiyang 550025,China;State key Laboratory of Public Big Data,,Guizhou University,Guiyang 550025,China;College of Mathematics&Statistics,Guizhou University,Guiyang 550025,China;College of Information,Guizhou University of Finance&Economics,Guiyang 550025,China)

机构地区:[1]贵州大学计算机科学与技术学院,贵阳550025 [2]贵州大学公共大数据国家重点实验室,贵阳550025 [3]贵州大学数学与统计学院,贵阳550025 [4]贵州财经大学信息学院,贵阳550025

出  处:《计算机应用研究》

基  金:国家自然科学基金资助项目(U1836205,61662009,61772008,11761020);贵州省科技计划项目(黔科合重大专项字[2018]3001,黔科合重大专项字[2018]3007,黔科合重大专项字[2017]3002,黔科合支撑[2019]2004,黔科合支撑[2018]2162,黔科合基础[2019]1049,黔科合基础[2017]1045);贵州财经大学科研基金资助项目(2017XJC01)。

年  份:2020

卷  号:37

期  号:10

起止页码:3077-3082

语  种:中文

收录情况:AJ、BDHX、BDHX2017、CSCD、CSCD_E2019_2020、IC、JST、RCCSE、UPD、ZGKJHX、ZMATH、核心刊

摘  要:如何对生产环境中经代码混淆的结构化数据集的敏感属性(字段)进行自动化识别、分类分级,已成为对结构化数据隐私保护的瓶颈。提出一种面向结构化数据集的敏感属性自动化识别与分级算法,利用信息熵定义了属性敏感度,通过对敏感度聚类和属性间关联规则挖掘,将任意结构化数据集的敏感属性进行识别和敏感度量化;通过对敏感属性簇中属性间的互信息相关性和关联规则分析,对敏感属性进行分组并量化其平均敏感度,实现敏感属性的分类分级。实验表明,该算法可识别、分类、分级任意结构化数据集的敏感属性,效率和精确率更高;对比分析表明,该算法可同时实现敏感属性的识别与分级,无须预知属性特征、敏感特征字典,兼顾了属性间的相关性和关联关系。

关 键 词:隐私保护 敏感属性识别与分级  最大熵 关联规则 互信息

分 类 号:TP309]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心