|
|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
* h1 f3 T* S' i% S: b, K
论文提出了一种解决大规模稀疏问题的多目标算法,大规模稀疏存在于许多领域:机器学习、数据挖掘、神经网络。
8 ?. O1 [ e8 e2 i3 | I# y作者主要讨论了四个具体的问题
0 ^: w' o5 ]4 X- ①特征选择
- ②模式挖掘
- ③关键节点检测
- ④神经网络训练
; p0 \9 w- d4 H$ J 上面四个问题虽然存在于不同领域,但是它们都属于多目标问题,它们的pareto面的解集都是稀疏的。举例来说,对于大规模特征选择问题,10000维中只能选取不到100个,压缩率达到了99%,是典型的稀疏问题。
7 P7 e* B; _8 P7 e1 U; q! g! Y; o4 v5 w0 |4 `+ ~/ }& c
具体问题
; \; q6 Z6 c( b* J3 `
5 E3 k2 Z) W1 T
/ d- F" a, a' F7 f" A! }# k% m+ t' M6 F
+ ^- M( I, g" }9 }
4 A5 G$ t4 Y' \* M5 S, ~
, O% _ ^: W2 ~) k& c算法的贡献: I- U2 }0 @2 E, _. | o' `) y
+ c" V$ S c2 X( j3 D6 D8 l
- ①设计了新的种群初始化策略(根据稀疏大规模特性,能够获得一个很好的前沿面)
- ②设计了新的基于pareto解集稀疏性的遗传算子
# {. W( t& N9 {& K7 F , _/ f7 h8 e# x
# P! ~7 U+ J/ X4 A/ b2 i
具体算法
4 l) p9 p6 b% a6 V ]$ O& i% }) w- _& E9 w
算法框架% C3 g+ K! \0 \- b7 S
+ q' q6 z# x% A类似于NSGA2的框架
T4 R' z. x% @8 S& F% |$ n* z) D% v" ~+ u
; `1 M! j- C- j; `' d' I& [; i
+ f& [% t2 B r8 r" y
& w1 b" K3 A6 D) W W# y初始化策略8 n7 u/ D5 v* c$ K2 b+ }
; u0 [- y: l8 m. G% Z+ y. }为了集成两种编码,需要引入两个向量,一个是决策变量向量dec (实际上是进化的解,对于01编码来说,可以全置1),另一个是掩码向量mask(实际上一个01向量,用来记录每个维度的好坏,好的置1),最终的决策变量是两者的内积。
& N$ D# D% r9 K- b- ^1 x' T. ]
6 b9 \' v! B0 o0 x2 O. C
* u) d# P8 j2 r7 G( W
) g( G4 m3 f# U8 o3 S/ B
经过初始化后的结果:: J) B7 A2 ^+ U4 ~ v4 p
! ^+ ^; a8 i2 d: T
# D7 x' R! P+ q" Y" z/ j: N
4 I9 q+ C9 p$ |可以看到,通过该初始化策略,获得一个一个近似于pareto面的良好分布。
3 c, x' m3 [/ h! B# M1 G. E* _+ b ^1 b F
& t. w) D' Y1 x6 j+ Q1 H$ W
交叉变异算子 ?: Q% V- c4 ^+ A6 x
, w$ ~8 F6 _( A/ H& ~
这个交叉变异是算法的核心,它每次在二进制向量mask中,以同样的概率每次在0元素中翻转一个元素,或者在非0元素中翻转一个元素,翻转是根据决策变量的适应度值进行的。因此,生成的子代不会有同样数量的0和1,并且可以保持子代的稀疏度。
8 _; O9 F! }. M. {9 I8 I; t8 g. S+ }$ ~, {2 I# F
' s1 i' M# R: w a1 l
0 z9 r+ y. a7 _6 L4 m8 C- u
采用交叉变异后的结果:) \4 F. E8 v' U
, j; l/ q! J9 C; k+ k* |4 Z
" h# o9 k8 D6 M0 U3 m7 `
1 ^& b ^$ Z* D, C2 e* L: N' l可以看到,通过此策略,提高了稀疏度,被置为1的维度越来越少。
2 s9 |$ ^( S& \- a) \& q- _2 c3 f0 g) p
. d/ b2 w( b1 S
其他
$ J2 k& Q" m" K6 g
4 X; p$ T: z: I5 r对于实验部分,作者设计了具体的测试套件,结果也非常乐观,在此不赘述。2 N4 U/ I: Z. q. f9 ~$ ?: v
|
|