找回密码
 注册
关于网站域名变更的通知
查看: 743|回复: 3
打印 上一主题 下一主题

最大相关最小冗余(mRMR)算法

[复制链接]

该用户从未签到

跳转到指定楼层
1#
发表于 2021-7-13 13:54 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式

EDA365欢迎您登录!

您需要 登录 才可以下载或查看,没有帐号?注册

x
+ m2 e2 X+ R+ a* ]& i. O, I
在做特征选择时,可能面临两个问题:特征与类别预测有多大相关性,特征之间有多大冗余度。在特征选择中,“最好的m个特征不一定是m个最好的特征”,从相关度与冗余度来看,最好的m个特征是指与分类最相关的特征,但由于最好的m个特征之间可能存在冗余,因此最相关的m个特征并不一定比其他m个特征产生更好的分类准确率。可以看出,特征选择可以分为两个过程:1、怎样度量特征相关性。2、怎样解决特征之间的冗余。0 b' H9 z1 C+ B, W' o. D  n9 X" ?

4 j2 D# `; z$ H2 f0 y互信息: z1 |4 u) o. y/ h5 p
/ m, O0 F) }  Q! N9 x

+ }- o3 p9 |8 U3 i8 \1 l" N8 K  C' H互信息可以度量两个变量x,y之间的相关关系。如下图所示:# P, ?4 ^* x) ~6 ?, N# P
" b- I- `& B" l# }

3 f1 H# y/ w5 w( |0 J5 o
/ h/ O" P+ ~$ X5 a. W0 L2 w4 J考虑特征x与分类目标c,计算I(x,c),I(x,c)的大小代表了x与c之间的关联度的大小。从所有特征中选出与c之间互信息最大的m个特征,就可以得到与c最相关的m个特征。1 R3 X4 n. F7 h
: L0 \1 L" F. B9 [  R& v  h" T
最大相关度与最小冗余度( q9 r# h; I3 ]$ o2 s: T, N" V

3 Q& C! N3 L6 O, K4 v8 A设S表示特征{xi}的集合,|S|=m. 为了选出m个最相关特征,使得S满足如下公式:: i7 {( Q, ]1 |
* q, R: R$ ]- V7 d' C

3 r8 e9 D) U( V8 X' k
% ]' H" n: A5 K6 m可见目标是选出m个平均互信息最大的集合S。
9 L. y; u% ^) Z5 HS很可能包含相关度很大的特征,也就是说特征之间存在冗余。集合S的冗余度如下式所示:% n+ r; W  w  C8 }7 z
4 W. B" g* k  e# R- b% [
$ Q' V5 e8 D- _4 P7 a  b8 G

1 [# H( M/ i4 v5 N最终目标是求出拥有最大相关度-最小冗余度的集合S,直接优化下式:- f- W) ?$ s0 I3 `! P* c( Z& k6 y
: O  t8 J+ L8 b1 T+ d5 o
% g: ]  _5 b7 t' `0 x# ]) I

, A0 t6 n  D1 d直观上说D的增大,R的减小都会使得目标函数增大。
! F# r( A7 l5 n5 Q$ w; v/ V' ]假设现在S中已有m-1个特征,现在需要从余下的特征中选择第m个特征。3 Y4 q: l* S+ M5 T

$ e& y! R0 G% u6 O% V/ c+ y- M5 Q* v" c
1 V( e$ Z- s( A
特征选择过程7 f, D; A+ g/ V2 T! N& c6 ^
! \+ c  c. G& A5 Z
特征选择的目的是选择出一个具有很好分类效果的精简特征集。为了达到此目的,可以分两步进行:第一步,利用mrmr选出候选特征集;第二步,利用其它方法选出精简特征集。
: b9 B; Q7 {) f- a" [1 }7 S! S" I1 Y' y( G/ E; F
, }7 }: }5 B3 U8 l% Y
主要步骤:( e7 m% K# g: d9 ^) K

2 R9 }4 K# B$ {$ Z& X; C
  • 将数据进行处理转换的过程(注:为了计算两个特征的联合分布和边缘分布,需要将数据归一化到[0,255]之间,并且将每一维特征使用合理的数据结构进行存储)
  • 计算特征之间、特征与响应变量之间的分布及互信息
  • 对特征进行mrmr得分,并进行排序- K8 K! T3 u1 R3 E9 z8 s

5 z% ~# p- X) G, N' C; z& e

该用户从未签到

2#
发表于 2021-7-13 15:18 | 只看该作者
最大相关最小冗余(mRMR)算法

该用户从未签到

3#
发表于 2021-7-13 15:19 | 只看该作者
最大相关最小冗余(mRMR)算法

该用户从未签到

4#
发表于 2021-7-13 15:20 | 只看该作者
最大相关最小冗余(mRMR)算法
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

推荐内容上一条 /1 下一条

EDA365公众号

关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

GMT+8, 2025-8-16 14:42 , Processed in 0.141601 second(s), 26 queries , Gzip On.

深圳市墨知创新科技有限公司

地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

快速回复 返回顶部 返回列表