关于网站域名变更的通知

EDA365电子论坛网»电子社区 › 研发技术版块 › MATLAB论坛 › 机器学习数据集制作与划分MATLAB实现

发新帖

查看: 403|回复: 1

上一主题

下一主题

机器学习数据集制作与划分MATLAB实现

该用户从未签到

电梯直达

跳转到指定楼层

1^#

发表于 2020-10-27 14:08 | 只看该作者 |只看大图回帖奖励

回帖奖励

|倒序浏览 |阅读模式

EDA365欢迎您登录！

您需要登录才可以下载或查看，没有帐号？注册

x

.mat数据集制作

若整个数据集是一个.mat文件且最后一列数据时标签，则单独将决策变量和标签划分开，一个为ins，另一个为lab。

.mat数据集说明

数据集名称GLIOMA

GIOMA包含两个矩阵，一个是实例矩阵或者叫决策变量（ins），另一个是标签矩阵（lab）

Ins矩阵大小50*4434，说明该GLIOMA数据集有50个实例（样本），有4434个特征，这50个实例（样本），每一个实例有一个对应的标签lab，标签就是类别。

打开Ins矩阵，有50行说明有50个实例（样本），有4434列说明有4434个特征（太多了显示不了），这里面的任意一个值（标量）叫做特征值，任意一列是特征向量（列向量），任意一行是实例向量（行向量）

打开lab矩阵

有50个标签，标签就是类别（比如1代表幼儿，2代表青年，以此类推），可以看到这是一个具有4个类别的数据集。

数据集划分为训练集和测试集代码
10折划分
说明：

①在代码目录下，新建文件夹dataset，将.mat数据集放入其中
②输入dataName是一个字符串，如数据集名称为GLIOMA.mat，则输入的dataName为 ‘GLIOMA’（不要加.mat）
③iter是算法运行的次数，运行第一次调用第一个随机划分的值，运行第i次调用第i次随机划分的值
④Indices是随机划分数据集的索引，iter = 1是生成，之后的则读取第一次生成的文件。
! {: G; A+ ?, D- y$ Q

function [train_F,train_L,test_F,test_L] = DIVDATA10fold(dataName,iter)
file = ['dataset/',dataName,'.mat'];
load(file)
fold = 10
dataMat=ins;
len=size(dataMat,1);
maxV = max(dataMat);
minV = min(dataMat);
range = maxV-minV;
newdataMat = (dataMat-repmat(minV,[len,1]))./(repmat(range,[len,1]));
if mod(iter, 10) == 1
Indices = crossvalind('Kfold', length(lab), fold);
save Indices;
else
load Indices;
end
site = find(Indices==iter);
test_F = newdataMat(site,：）;
test_L = lab(site);
site2 = find(Indices~=iter);
train_F = newdataMat(site2,：）;
train_L =lab(site2);
end
$ S- G/ U, I. c

三七划分
三七划分和十折划分类似，只是少了个输入参数和全局变量

function [train_F,train_L,test_F,test_L] = DIVDATA37(dataName)
file = ['dataset/',dataName,'.mat'];
load(file)
7 u, {7 h$ ~. Y( Z/ X
dataMat=ins;
len=size(dataMat,1);
%归一化
! N/ U, z2 g1 s" |
maxV = max(dataMat);
minV = min(dataMat);
range = maxV-minV;
newdataMat = (dataMat-repmat(minV,[len,1]))./(repmat(range,[len,1]));
9 Z% t) X* Q ]/ v0 Z8 t5 r- w$ x% @
Indices = crossvalind('Kfold', length(lab), 10);
site = find(Indices==1|Indices==2|Indices==3);
test_F = newdataMat(site,：）;
test_L = lab(site);
site2 = find(Indices~=1&Indices~=2&Indices~=3);
train_F = newdataMat(site2,：）;
train_L =lab(site2);
end
& o1 x3 S2 e! h

收藏0 淘帖0 支持！0 反对！0

下载资料威望不够？点击查看获取威望的N种方法>>

回复

EDA365微信号及QQ群号！

该用户从未签到

2^#

发表于 2020-10-27 14:52 | 只看该作者

机器学习数据集制作与划分MATLAB实现

下载资料威望不够？点击查看获取威望的N种方法>>

回复支持反对

发新帖

推荐内容 /1

EDA365公众号

关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

GMT+8, 2025-11-24 07:38 , Processed in 0.187500 second(s), 26 queries , Gzip On.

深圳市墨知创新科技有限公司

地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

快速回复 返回顶部 返回列表