期刊文章详细信息
基于文本内容的敏感数据识别方法研究与实现
Research and implementation of sensitive data identification method based on text content
文献类型:期刊文章
机构地区:[1]中国电力科学研究院南京分院,江苏南京211100
基 金:国家863高技术研究发展计划基金项目(2012AA050802);国家电网公司科技攻关团队基金项目(SG11034)
年 份:2013
卷 号:34
期 号:4
起止页码:1202-1206
语 种:中文
收录情况:AJ、BDHX、BDHX2011、CSA、CSA-PROQEUST、CSCD、CSCD_E2013_2014、IC、INSPEC、JST、RCCSE、ZGKJHX、核心刊
摘 要:为了防止敏感数据的泄露,为数据的访问控制提供依据,提出并实现了一种基于中文文本内容的敏感数据识别方法。通过对敏感数据库和已知分类文档库的学习,完成对文本中敏感数据识别的阙值的确定和未知文档是否敏感数据的判断过程。描述了预处理、文本识别、阙值确定的详细设计和实现过程。通过对搜狗语料库中教育相关部分文本的识别,验证该方法的敏感数据识别过程简单实用并且具有较高的正确率。
关 键 词:敏感数据 文本识别 内容识别 数据防泄漏 分类算法
分 类 号:TP393]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...