|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
3 Y" h( y/ W7 [8 ?
摘要:现有的面向大规模数据分类的支持向量机( support vector machine,SVM)对噪声样本敏感,针对这一问题,通过定义软性核凸包和引入pinmball损失函数,提出了一种新的软性核凸包支持向量机( softkernel convex_hull sup-port vector machine for large scale noisy datasets ,SCH-SVM).SCH-SVM首先定义了软性核凸包的概念,然后选择出能代表样本在核空间几何轮廓的软性核凸包向量,再将其对应的原始空间样本作为训练样本并基于pinmball损失函数来寻找两类软性核凸包之间的最大分位数距离.相关理论和实验结果亦证明了所提分类器在训练时间,抗噪能力和支持向量数上的有效性.
6 [* x/ g5 K/ T' G( o4 x6 Y" `
4 W# |4 a# O. b+ Z- O关键词:大规模数据;噪声;软性核凸包;pinball损失函数﹔分类
7 Z8 v1 s" z1 P8 t# a0 s! \# N# N j- E' B+ _8 I# c
支持向量机(Support Vector Machine ,SVM)使用统计学习理论和最优化方法解决机器学习问题,凭借其优秀的泛化性能成为模式识别领域一个非常重要的分支.其最优化问题常描述成二次规划问题.对于样本数为ⅣN的数据集来说,训练SVM分类器的时间复杂度为o(N).为降低SVM的计算复杂度,常用的方法有:逼近替代二次规划问题中的核矩阵计算,如贪婪逼近,矩阵分解法和矩阵变换法等;减少训练样本数或限制支持向量数,如核心集向量机,快速核密度估计,近似极值点支持向量机和采样SVM等.0 Q2 i8 J+ ?1 A/ Z7 T
3 b# v% H- z2 o! \) N
; e; H. G8 ?2 t7 `
% y4 _. X' m9 }4 k+ k4 n5 g5 v
* i6 ^2 d& [+ A+ y6 A6 G- \2 v4 m z, N9 }
' g2 O# e* T; m& e0 v( J5 N: T- L |
|