|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
) b* e C- A7 c
摘要:现有的面向大规模数据分类的支持向量机( support vector machine,SVM)对噪声样本敏感,针对这一问题,通过定义软性核凸包和引入pinmball损失函数,提出了一种新的软性核凸包支持向量机( softkernel convex_hull sup-port vector machine for large scale noisy datasets ,SCH-SVM).SCH-SVM首先定义了软性核凸包的概念,然后选择出能代表样本在核空间几何轮廓的软性核凸包向量,再将其对应的原始空间样本作为训练样本并基于pinmball损失函数来寻找两类软性核凸包之间的最大分位数距离.相关理论和实验结果亦证明了所提分类器在训练时间,抗噪能力和支持向量数上的有效性.. B! }/ g$ e. k! P
5 E0 B1 @& X' s6 `: Y( l关键词:大规模数据;噪声;软性核凸包;pinball损失函数﹔分类& y* O, \2 G5 i( x
8 `& D7 U; C) v) J% i
支持向量机(Support Vector Machine ,SVM)使用统计学习理论和最优化方法解决机器学习问题,凭借其优秀的泛化性能成为模式识别领域一个非常重要的分支.其最优化问题常描述成二次规划问题.对于样本数为ⅣN的数据集来说,训练SVM分类器的时间复杂度为o(N).为降低SVM的计算复杂度,常用的方法有:逼近替代二次规划问题中的核矩阵计算,如贪婪逼近,矩阵分解法和矩阵变换法等;减少训练样本数或限制支持向量数,如核心集向量机,快速核密度估计,近似极值点支持向量机和采样SVM等.
5 R2 D' A2 i8 l( Y' I
3 W0 d2 ~% }" ?+ p/ {- \& r# b
{1 T) s) A9 D8 r I: Q1 S* f D
! G( E# i9 j5 k U* p' q& R9 i R$ Z
/ X. p% A% ]& C+ h# A7 }% x% U p$ I. X* j3 `1 g
|
|