找回密码
 注册
关于网站域名变更的通知
查看: 780|回复: 3
打印 上一主题 下一主题

最大相关最小冗余(mRMR)算法

[复制链接]

该用户从未签到

跳转到指定楼层
1#
发表于 2021-7-13 13:54 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式

EDA365欢迎您登录!

您需要 登录 才可以下载或查看,没有帐号?注册

x
' \. d$ h' |+ F4 B+ H
在做特征选择时,可能面临两个问题:特征与类别预测有多大相关性,特征之间有多大冗余度。在特征选择中,“最好的m个特征不一定是m个最好的特征”,从相关度与冗余度来看,最好的m个特征是指与分类最相关的特征,但由于最好的m个特征之间可能存在冗余,因此最相关的m个特征并不一定比其他m个特征产生更好的分类准确率。可以看出,特征选择可以分为两个过程:1、怎样度量特征相关性。2、怎样解决特征之间的冗余。
0 t* F+ e7 b* t# }
. t! P" B1 E* c3 i# W8 p2 j4 w" I$ C互信息0 W; z$ h2 e4 o5 T
# t4 n# |* Y% D6 i) ~

9 \3 g' _- ^0 S. X( g互信息可以度量两个变量x,y之间的相关关系。如下图所示:
& \9 l/ [6 L/ m
) V1 E( h+ c% a, v& |# V! @
0 r' |+ D; |7 \4 X0 a  D3 O/ D
# B; c/ ?& a$ y4 H考虑特征x与分类目标c,计算I(x,c),I(x,c)的大小代表了x与c之间的关联度的大小。从所有特征中选出与c之间互信息最大的m个特征,就可以得到与c最相关的m个特征。7 \+ F% _1 [% A# Q& _8 m
5 k3 z% B# v' I, k( {+ @% @
最大相关度与最小冗余度0 K/ H# i$ g; ~; l) T, ]- d0 h

# j  Z) z3 a1 J- j设S表示特征{xi}的集合,|S|=m. 为了选出m个最相关特征,使得S满足如下公式:
0 z$ N4 [/ d  z
7 D$ B2 l8 x% F4 l8 l, | 5 Y% x6 C5 ?+ k+ D5 ~* a8 U
) `' g9 q, {! u; [
可见目标是选出m个平均互信息最大的集合S。
& j$ I3 A7 S  N. ~; b1 f. tS很可能包含相关度很大的特征,也就是说特征之间存在冗余。集合S的冗余度如下式所示:5 Q+ X  N7 C" }% T

, F# B! a2 S* X% G2 K
' Y( m! _) y- C4 I
. ^& T, q. S. j最终目标是求出拥有最大相关度-最小冗余度的集合S,直接优化下式:
& l1 D3 ^( h8 l) _. q# F! \9 o" V  T& l1 p! ~

! l3 w+ x+ W* J0 D* k$ _9 V! {( V2 `
直观上说D的增大,R的减小都会使得目标函数增大。7 o5 P9 F( j) n  d
假设现在S中已有m-1个特征,现在需要从余下的特征中选择第m个特征。8 G  F; \0 e$ \

8 K) Q5 m4 k0 ^7 |' _$ K& p! c6 Z1 _

  l1 [! {) e$ t( h. q特征选择过程
0 [/ o# _% m, t8 m" h* b( O8 w9 k) b  M3 F
特征选择的目的是选择出一个具有很好分类效果的精简特征集。为了达到此目的,可以分两步进行:第一步,利用mrmr选出候选特征集;第二步,利用其它方法选出精简特征集。- [1 m: x6 Z! I& B7 C) f

  e: C/ B7 n5 @9 I
" G6 _: S0 S2 _( h3 ^主要步骤:3 Z( C4 ~) `) X2 d; ]4 ]
4 m1 ~7 J' P3 c) {) k1 Q) T- f1 [0 r, i
  • 将数据进行处理转换的过程(注:为了计算两个特征的联合分布和边缘分布,需要将数据归一化到[0,255]之间,并且将每一维特征使用合理的数据结构进行存储)
  • 计算特征之间、特征与响应变量之间的分布及互信息
  • 对特征进行mrmr得分,并进行排序
    & M( a0 O) |& S" ]# k

. P& k/ @. ~, ^2 G

该用户从未签到

2#
发表于 2021-7-13 15:18 | 只看该作者
最大相关最小冗余(mRMR)算法

该用户从未签到

3#
发表于 2021-7-13 15:19 | 只看该作者
最大相关最小冗余(mRMR)算法

该用户从未签到

4#
发表于 2021-7-13 15:20 | 只看该作者
最大相关最小冗余(mRMR)算法
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

推荐内容上一条 /1 下一条

EDA365公众号

关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

GMT+8, 2025-11-23 23:58 , Processed in 0.140625 second(s), 26 queries , Gzip On.

深圳市墨知创新科技有限公司

地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

快速回复 返回顶部 返回列表