期刊文章详细信息
基于文本内容的敏感词决策树信息过滤算法
Information Filtering Algorithm of Text Content-based Sensitive Words Decision Tree
文献类型:期刊文章
机构地区:[1]重庆大学信息与网络管理中心,重庆400030 [2]重庆大学计算机学院,重庆400030
年 份:2014
卷 号:40
期 号:9
起止页码:300-304
语 种:中文
收录情况:AJ、CAS、CSA、CSA-PROQEUST、CSCD、CSCD2013_2014、IC、INSPEC、JST、RCCSE、SCOPUS、UPD、ZGKJHX、普通刊
摘 要:随着互联网的高速发展,各种各样的信息资源呈指数级增长,随之出现许多负面影响,需要构建一个安全健康的网络环境。为此,提出针对网页文本内容的敏感信息过滤算法(SWDT-IFA)。该算法不依赖词典与分词,通过构建敏感词决策树,将网页文本内容以数据流形式检索决策树,记录敏感词词频、区域信息以及敏感词级别,计算文本整体敏感度,过滤敏感文本。实验结果表明,SWDT-IFA算法具有较高的查准率和查全率,且执行时间能够满足当前网络环境的实时性要求。
关 键 词:文本过滤 敏感级别 决策树 分流 词频
分 类 号:TP393]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...