关于网站域名变更的通知

EDA365电子论坛网»电子社区 › 研发技术版块 › MATLAB论坛 › 基于留一法的快速KNN代码

发新帖

查看: 743|回复: 3

上一主题

下一主题

基于留一法的快速KNN代码

TA的每日心情

	衰 2019-11-19 15:32

签到天数: 1 天

[LV.1]初来乍到

电梯直达

跳转到指定楼层

1^#

发表于 2021-7-12 14:14 | 只看该作者 |只看大图回帖奖励

回帖奖励

|正序浏览 |阅读模式

EDA365欢迎您登录！

您需要登录才可以下载或查看，没有帐号？注册

x

留一法交叉验证（LOOCV）
留一法即Leave-One-Out Cross Validation。这种方法比较简单易懂，就是把一个大的数据集分为k个小数据集，其中k-1个作为训练集，剩下的一个作为测试集，然后选择下一个作为测试集，剩下的k-1个作为训练集，以此类推。其主要目的是为了防止过拟合，评估模型的泛化能力。计算时间较长。

适用场景：

数据集少，如果像正常一样划分训练集和验证集进行训练，那么可以用于训练的数据本来就少，还被划分出去一部分，这样可以用来训练的数据就更少了。loocv可以充分的利用数据。

快速留一法KNN

因为LOOCV需要划分N次，产生N批数据，所以在一轮训练中，要训练出N个模型，这样训练时间就大大增加。为了解决这样的问题，根据留一法的特性，我们可以提前计算出不同样本之间的距离（或者距离的中间值），存储起来。使用LOOCV时直接从索引中取出即可。下面的代码以特征选择为Demo，验证快速KNN留一法。

其中FSKNN1是普通KNN，FSKNN2是快速KNN

主函数main.m

clc
[train_F,train_L,test_F,test_L] = divide_dlbcl();
dim = size(train_F,2);
individual = rand(1,dim);
global choice
choice = 0.5;
global knnIndex
[knnIndex] = preKNN(individual,train_F);
for i = 1:100
[error,fs] = FSKNN1(individual,train_F,train_L);
[error2,fs2] = FSKNN2(individual,train_F,train_L);
end
+ D! k+ i# P: I: F! K7 _

数据集划分divide_dlbcl.m

function [train_F,train_L,test_F,test_L] = divide_dlbcl()
load DLBCL.mat;
dataMat=ins;
len=size(dataMat,1);
%归一化
maxV = max(dataMat);
minV = min(dataMat);
range = maxV-minV;
newdataMat = (dataMat-repmat(minV,[len,1]))./(repmat(range,[len,1]));
Indices = crossvalind('Kfold', length(lab), 10);
site = find(Indices==1|Indices==2|Indices==3);
test_F = newdataMat(site,：);
test_L = lab(site);
site2 = find(Indices~=1&Indices~=2&Indices~=3);
train_F = newdataMat(site2,：);
train_L =lab(site2);
end
. {+ O& g5 p, w* r

简单KNN

FSKNN1.m

function [error,fs] = FSKNN1(x,train_F,train_L)
global choice
inmodel = x>choice;%%%%%设定恰当的阈值选择特征
k=1;
train_f=train_F(:,inmodel);
train_length = size(train_F,1);
flag = logical(ones(train_length,1));
error=0;
for j=1:train_length
flag(j) = 0;
CtrainF = train_f(flag,：);
CtrainL = train_L(flag);
CtestF = train_f(~flag,：);
CtestL = train_L(~flag);
classifyresult= KNN1(CtestF,CtrainF,CtrainL,k);
if (CtestL~=classifyresult)
error=error+1;
end
flag(j) = 1;
end
error=error/train_length;
fs = sum(inmodel);
end
# f- F2 o h! t1 \' g! Y

KNN1.m

function relustLabel = KNN1(inx,data,labels,k)
%%
% inx 为输入测试数据，data为样本数据，labels为样本标签 k值自定1~3
%%
[datarow , datacol] = size(data);
diffMat = repmat(inx,[datarow,1]) - data ;
distanceMat = sqrt(sum(diffMat.^2,2));
[B , IX] = sort(distanceMat,'ascend');
len = min(k,length(B));
relustLabel = mode(labels(IX(1:len)));
end
6 F* z7 i! e) U: @, m6 n9 D8 Y

快速KNN

preKNN.m

function [knnIndex] = preKNN(x,train_F)
inmodel = x > 0;
train_f=train_F(:,inmodel);
train_length = size(train_F,1);
flag = logical(ones(train_length,1));
knnIndex = cell(train_length,1);
for j=1:train_length
flag(j) = 0;
CtrainF = train_f(flag,：);
CtestF = train_f(~flag,：);
[datarow , ~] = size(CtrainF);
diffMat = repmat(CtestF,[datarow,1]) - CtrainF ;
diffMat = diffMat.^2;
knnIndex{j,1} = diffMat;
flag(j) = 1;
end
end
~: @" c$ z6 ? @; d

FSKNN2.m

function [error,fs] = FSKNN2(x,train_F,train_L)
global choice
inmodel = x>choice;%%%%%设定恰当的阈值选择特征
global knnIndex
k=1;
train_length = size(train_F,1);
flag = logical(ones(train_length,1));
error=0;
for j=1:train_length
flag(j) = 0;
CtrainL = train_L(flag);
CtestL = train_L(~flag);
classifyresult= KNN2(CtrainL,k,knnIndex{j}(:,inmodel));
if(CtestL~=classifyresult)
error=error+1;
end
flag(j) = 1;
end
error=error/train_length;
fs = sum(inmodel);
end p* L9 K0 @! z

KNN2.m

function relustLabel = KNN2(labels,k,diffMat)
distanceMat = sqrt(sum(diffMat,2));
[B , IX] = sort(distanceMat,'ascend');
len = min(k,length(B));
relustLabel = mode(labels(IX(1:len)));
end
* {: i0 t, n5 W

结果

可以看到FSKNN2+preKNN的时间比FSKNN1要少很多。

收藏0 淘帖0 支持！0 反对！0

下载资料威望不够？点击查看获取威望的N种方法>>

回复

EDA365微信号及QQ群号！

该用户从未签到

4^#

发表于 2021-7-12 15:10 | 只看该作者

基于留一法的快速KNN代码

下载资料威望不够？点击查看获取威望的N种方法>>

回复支持反对

该用户从未签到

3^#

发表于 2021-7-12 15:10 | 只看该作者

基于留一法的快速KNN代码

下载资料威望不够？点击查看获取威望的N种方法>>

回复支持反对

该用户从未签到

2^#

发表于 2021-7-12 15:08 | 只看该作者

基于留一法的快速KNN代码

下载资料威望不够？点击查看获取威望的N种方法>>

回复支持反对

发新帖

推荐内容 /1

EDA365公众号

关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

GMT+8, 2025-11-23 20:23 , Processed in 0.171875 second(s), 27 queries , Gzip On.

深圳市墨知创新科技有限公司

地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

快速回复 返回顶部 返回列表