找回密码
 注册
关于网站域名变更的通知
查看: 745|回复: 1
打印 上一主题 下一主题

[毕业设计] 随机投影的贝叶斯时间差分算法

[复制链接]

该用户从未签到

跳转到指定楼层
1#
发表于 2021-7-19 10:27 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

EDA365欢迎您登录!

您需要 登录 才可以下载或查看,没有帐号?注册

x
摘  要 :  在 强 化 学 习 方 法 中 , 大 部 分 的 算 法 都 是 基 于 值 函 数 评 估 的 算 法 . 高 斯 过 程 时 间 差 分 算 法 利 用 贝 叶 斯 方, c6 q  Y7 P7 ?/ j! u; _- o
法 来 评 估 值 函 数 , 通 过 贝 尔 曼 公 式 和 贝 叶 斯 规 则 , 建 立 立 即 奖 赏 与 值 函 数 之 间 的 概 率 生 成 模 型 . 在 状 态 空 间 中 , 通 过 在! l6 K% M5 \) _1 K: b& k- v3 u
线 核 稀 疏 化 并 利 用 最 小 二 乘 方 法 来 求 解 新 样 本 的 近 似 线 性 逼 近 , 以 提 高 算 法 的 执 行 速 度 , 但 时 间 复 杂 度 依 然 较 高 . 针7 q. E+ N7 @" `6 J! c9 ?
对 在 状 态 空 间 中 近 似 状 态 的 选 择 问 题 , 在 高 斯 过 程 框 架 下 提 出 一 种 基 于 随 机 投 影 的 贝 叶 斯 时 间 差 分 算 法 , 该 算 法 利 用7 D) o4 P: M" p* p' f4 p
哈 希 函 数 把 字 典 状 态 集 合 中 的 元 素 映 射 成 哈 希 值 , 根 据 哈 希 值 进 行 分 组 , 进 而 减 少 状 态 之 间 的 比 较 . 实 验 结 果 表 明 , 该
4 k7 L; c0 T/ R3 V$ P6 `方 法 不 仅 能 够 提 高 算 法 的 执 行 速 度 , 而 且 较 好 地 平 衡 了 评 估 状 态 值 函 数 精 度 和 算 法 执 行 时 间 .1 S& l, C/ D' k( v. ^. D
关 键 词 :  强 化 学 习 ; 马 尔 科 夫 决 策 过 程 ; 高 斯 过 程 ; 随 机 投 影 ; 时 间 差 分 算 法
  Y5 @" k& H6 ~, P: R 一种基于随机投影的贝叶斯时间差分算法.pdf (1.13 MB, 下载次数: 0) " g0 x  @9 U1 y6 s  B4 x% S# U) a
3 R5 A, G  O: `5 r5 d) i

该用户从未签到

2#
发表于 2021-7-19 10:46 | 只看该作者
随机投影的贝叶斯时间差分算法,收藏了。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

推荐内容上一条 /1 下一条

EDA365公众号

关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

GMT+8, 2025-9-4 22:39 , Processed in 0.125000 second(s), 26 queries , Gzip On.

深圳市墨知创新科技有限公司

地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

快速回复 返回顶部 返回列表