期刊文章详细信息
文献类型:期刊文章
机构地区:[1]中国人民解放军95034部,队广西百色533616 [2]空军工程大学信息与导航学院,西安710077 [3]空军后勤部,北京100720
基 金:国家自然科学基金项目(61201209);陕西省自然科学基金重点项目(2012JZ8005);全军军事学研究生课题(2010JYXXXX-488)
年 份:2014
卷 号:51
期 号:11
起止页码:2458-2469
语 种:中文
收录情况:AJ、BDHX、BDHX2011、CSA-PROQEUST、CSCD、CSCD2013_2014、EI、IC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:在当前骨干网络链路速率呈几何倍数增长的情况下,实时准确地挖掘出网络流中的频繁项对于网络管理和网络安全具有重要的意义.在SS(space saving)计数算法的启发之下,针对网络流的实际特性,提出了一种剪枝操作受时间和流长双重约束的网络流频繁项挖掘算法(integrated weighted frequent items mining,IWFIM).IWFIM计数算法采用时间和流长组合赋权的方式为每个流项赋权,且算法每次剪枝操作时总是删除权值最小的流项.在IWFIM算法的基础上,依据网络流的重尾分布特性,又提出了一种能够结合散列方法和计数方法优点的网络流频繁项挖掘算法(counting Blooming filter and integrated weighted frequent items mining,CBF_IWFIM).CBF_IWFIM算法首先采用改进的计数型布鲁姆过滤器(counting Blooming filter,CBF)在不保存网络流信息的情况下过滤掉绝大部分的短流,然后采用IWFIM算法实现网络流频繁项挖掘.通过实际网络流量测试表明,CBF_IWFIM和IWFIM算法具有非常高的空间利用率和准确率,2种算法对于网络流频繁项的挖掘效果明显优于SS等3种算法,即使在使用其他算法1?3缓存的极端情况下,CBF_IWFIM和IWFIM 2种算法的频繁项识别效果仍然要优于SS等算法.
关 键 词:网络流 频繁项 数据挖掘 剪枝策略 计数算法 散列算法 重尾分布 计数型布鲁姆过滤器
分 类 号:TP393] TP311[计算机类]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...