|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
属性约简准则与约简信息损失的研究 9 h) a2 a2 c: a. }- k" d" V
摘要:属性约简是粗糙集的重要研究内容,信息嫡是度量信息量的方法.在研究绝对约简和几种相对约简的基础上,归纳出属性约简的一般准则.定义了基于条件属性信息嫡的属性约简和基于联合嫡的属性约简,研究了几种属性约简与绝对约简之间的关系.定义了基于条件属性信息嫡的约简信息损失,澄清了属性约简不损失信息的含糊观念,指出了属性约简只是在约简准则意义下不损失信息,在信息嫡意义下可能损失信息.为进一步研究粗糙集,粒计算中属性约简与分类夯实了信息论基础.) w3 |; k8 d2 v7 u5 h
关键词:粗糙集;属性约简;信息嫡;联合嫡;信息损失
+ B/ p* s7 S: }8 M R+ k, L |# }* Q$ E! ~* j. f2 O
1引言
# \0 e1 I, A2 f4 M$ l& d粒计算[12]是人类智能处理问题的思维方式,也是处理不确定性问题的方法.粒计算的主要方法有模糊集[3]、粗糙集4~7]、商空间[8和云模型”等.粗糙集理论[4~”是一种处理不精确、不完全、含糊数据的有效数学工具,是数据挖掘和分类的重要方法.
% p! R' |1 I5 U+ }" ]9 F3 J粗糙集最重要的应用在于不确定性分析和属性约简.研究者们提出了上、下近似+~7]、隶属度[10]、信息嫡"]、条件嫡[1213]、粗糙嫡、模糊嫡[115]等不确定性度量来刻画和描述数据的不确定性,其中很大一部分不确定性指标被用来作为条件属性约简的准则,例如:条件嫡、互信息等,由此衍生出了各种各样关于属性约简的研究["~23].几乎所有的条件属性约简都笼统地宣称保持分类不变或信息不变,人们也非常认同这个观点.但是条件属性约简是否真的保持信息不变、信息无损
5 o" L( J9 }2 ~* G' O, }/ P$ s# n( d- R
/ _" B+ |' {) ~4 Z, j- `
; ?$ u% r- P4 h& K; o5 X
8 N' V% i* c7 C W; H9 S, n5 Z* N M# ` |
|