期刊文章详细信息
文献类型:期刊文章
机构地区:[1]重庆邮电大学移通学院计算机科学系,重庆401520 [2]郑州成功财经学院信息工程系,河南郑州451200 [3]重庆邮电大学计算机科学与技术学院,重庆400065
基 金:重庆市教委科学技术研究基金项目(KJ1402002)
年 份:2017
卷 号:38
期 号:7
起止页码:1965-1971
语 种:中文
收录情况:BDHX、BDHX2014、IC、JST、RCCSE、ZGKJHX、核心刊
摘 要:针对现有文本分类模型的表现度低且缺乏容易理解的表示形式,提出一种模糊语法方法,并将其应用到犯罪文本分类中。根据定义的语法词典,将文本转化为模糊语法;将派生语法结合为更加紧凑的语法,获取学习文本模型的一般表示;将学习的模糊语法与测试集合进行匹配,根据解析隶属度的级别进行分类。与支持向量机、朴素贝叶斯、boosting方法和k最近邻等方法相比,所提FGM算法的性能与其它机器学习方法的性能类似;学习模型发生轻微变化,不需要传统方式的重建;在有些方面更加突出,如其在对爆炸事件的分类中获取了最高的F值(83%左右)以及最高的查准度(94%左右);很容易整合到更加全面的语法系统中。
关 键 词:模糊语法 文本分类 派生语法 学习 隶属度
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...