期刊文章详细信息
文献类型:期刊文章
机构地区:[1]山东师范大学信息科学与工程学院,济南250014 [2]山东师范大学山东省分布式计算机软件新技术重点实验室,济南250014 [3]山东师范大学实验室与设备管理处,济南250014
年 份:2016
卷 号:31
期 号:4
起止页码:60-65
语 种:中文
收录情况:CAS、IC、ZGKJHX、普通刊
摘 要:数据归一化是训练支持向量机(SVM)必须的数据预处理过程.常用的归一化方法有[-1,+1]、N(0,1)等方法,但现有文献尚未发现关于这些常用归一化方法科学依据方面的研究.本文以经验性的实验对数据归一化的理由、归一化与不归一化对训练效率和模型预测能力影响等方面开展研究.论文选择标准数据集,对原始未归一化、不同方法归一化、人工逆归一化、任选数据属性列等情况下的数据分别进行了SVM训练,并记录目标函数值随迭代次数的变化、训练时间、模型测试及k-CV性能等信息.实验结果表明,将数据值限制在常规范围内的归一化方法,如[-0.5,+0.5]-[-5,+5]、N(0,1)-N(0,5)等均能在训练时间最短的情况下获得最佳的预测模型.本文工作为SVM以及一般机器学习算法的数据归一化提供了科学依据.
关 键 词:支持向量机 数据归一化 数据预处理 交叉验证
分 类 号:TP391.41]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...