|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
用Actor-Critic算法实现对倒立摆的稳定控制,参考了别人的代码,用类的方法实现了神经网络,就是不能控制成功。输出结果如下:
: R3 M2 A/ O* B1 z
& d& x; J* I6 z( A Trial # 98 has 8 time steps.
- R2 D/ X( H2 j1 P/ v/ f% w Trial # 99 has 8 time steps.# w/ W. F5 U! g7 z7 ~0 F3 P
Trial # 100 has 6 time steps.
) g- z& u, Y4 I B" c$ @* d& }: B' _" O' K
) j8 }8 e# `, B" Y) v* k
总共用了100次尝试。明明只用面向对象的方法改了别人的神经网络的代码,怎么解决啊?9 ^' G1 _, z% r/ u$ S
Code.zip
(5.94 KB, 下载次数: 0)
: Q% f4 s3 Q" W% F( L5 i/ y# r$ j& B |
|