用Actor-Critic算法实现对倒立摆的稳定控制

zaiyiaaaa · 发表于 2020-11-12 10:12

EDA365欢迎您登录！

您需要登录才可以下载或查看，没有帐号？注册

x

用Actor-Critic算法实现对倒立摆的稳定控制，参考了别人的代码，用类的方法实现了神经网络，就是不能控制成功。输出结果如下：

         Trial # 98 has  8 time steps.
         Trial # 99 has  8 time steps.
         Trial # 100 has  6 time steps.

总共用了100次尝试。明明只用面向对象的方法改了别人的神经网络的代码，怎么解决啊？

Code.zip (5.94 KB, 下载次数: 0)

zzz.dan · 发表于 2020-11-12 10:37

程序里强化信号给的不对啊，不需要转化到角度，用弧度即可

kekek · 发表于 2020-11-12 14:08

来学习一下

nkkopd · 发表于 2020-11-12 15:34

一楼正解！

帐号		自动登录	找回密码
密码			注册

用Actor-Critic算法实现对倒立摆的稳定控制

EDA365欢迎您登录！

浏览过的版块

推荐内容 /1