期刊文章详细信息
基于TF-IDF和改进BP神经网络的社交平台垃圾文本过滤
Social Platform Spam Filtering Based on TF-IDF and Optimized BP Neural Network
文献类型:期刊文章
WANG Yang;WANG Fei-Fan;ZHANG Shu-Yi;HUANG Shao-Fen;XU Shan-Shan;ZHAO Chen-Xi;ZHAO Chuan-Xin(School of Computer and Information,Anhui Normal University,Wuhu 241000,China)
机构地区:[1]安徽师范大学计算机与信息学院,芜湖241000
基 金:国家自然科学基金(61572036);安徽省社科规划项目(AHSKY2017D42);安徽省重大人文社科基金(SK2014ZD033)~~
年 份:2019
卷 号:28
期 号:3
起止页码:126-132
语 种:中文
收录情况:CSA、IC、ZGKJHX、普通刊
摘 要:近年来,随着生活节奏的提高和互联网的迅速发展,人们更倾向于在众多社交平台上用短文本进行交流,进而可能有人通过发布垃圾文本妨碍人们的正常社交,扰乱网络的绿色环境.为了解决这个问题,我们提出了基于TF-IDF和改进BP神经网络的社交平台垃圾文本检测的方法.通过该方法,实现对社交平台上的垃圾文本过滤.首先,通过结巴分词和去停分词构造关键词数据集;其次,对文本表示的关键词向量运用计算各关键词的权重从而对文本向量进行降维,得到特征向量;最后,在此基础上,运用BP神经网络分类器对短文本进行分类,检测出垃圾文本并进行过滤.实验结果表明用该方法在1000维文本特征向量的情况下分类平均准确率达到了97.720%.
关 键 词:TF-IDF 改进BP神经网络 结巴分词 垃圾文本过滤
分 类 号:TP391.1] TP183[计算机类]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...