×
思维导图备注
强化学习精要:核心算法与TensorFlow实现
首页
收藏书籍
阅读记录
书签管理
我的书签
添加书签
移除书签
第二部分 最优价值算法
浏览
4
扫码
小字体
中字体
大字体
2022-02-28 17:51:27
请
登录
再阅读
上一篇:
下一篇:
版权页
前言
目录
第一部分 强化学习入门与基础知识
1 引言
4 TensorFlow入门
5 Gym与Baselines
第二部分 最优价值算法
7 Q-Learning基础
第三部分 基于策略梯度的算法
9 基于策略梯度的算法
10 使策略单调提升的优化算法
11 Off-Policy策略梯度法
第四部分 其他强化学习算法
12 稀疏回报的求解方法
13 Model-based方法
第五部分 反向强化学习
14 反向强化学习入门
2 数学与机器学习基础
3 优化算法
6 强化学习基本算法
8 DQN的改进算法
15 反向强化学习算法2.0
暂无相关搜索结果!
×
二维码
手机扫一扫,轻松掌上学
×
《强化学习精要:核心算法与TensorFlow实现》电子书下载
请下载您需要的格式的电子书,随时随地,享受学习的乐趣!
EPUB 电子书
×
书签列表
×
阅读记录
阅读进度:
0.00%
(
0/0
)
重置阅读进度