【Udemy中英字幕】Advanced Reinforcement Learning in Python: from DQN to SAC

站长

2022-08-25 Udemy 0 217

郑重承诺丨视频中英文字幕配套课件

升级会员

增值服务：免费提供代找课服务：

49.9 金币

VIP折扣

折扣详情

体验会员
免费
包月会员
免费
包年会员
免费
永久会员
免费

开通VIP尊享优惠特权

点赞 (0) 收藏 (0)

立即下载升级会员

微信扫码咨询

站长

联系Ta

进入TA的商铺联系官方客服

信息属性

详情介绍

Python 中的高级强化学习：从 DQN 到 SAC

使用深度强化学习和 PyTorch 构建人工智能 (AI) 代理：DDPG、TD3、SAC、NAF、HER

讲师：Escape Velocity Labs

双语IT资源独家Udemy付费课程，独家中英文字幕，配套资料齐全！

用不到1/10的价格，即可享受同样的高品质课程，且可以完全拥有，随时随地都可以任意观看和分享。

你将会学到的

掌握一些最先进的强化学习算法。
了解如何创建可以在复杂环境中行动以实现其目标的 AI。
使用 Python 最流行的工具（PyTorch Lightning、OpenAI gym、Brax、Optuna）从头开始创建高级强化学习代理
了解如何执行超参数调整（为我们的 AI 学习选择最佳实验条件）
从根本上了解每种算法的学习过程。
调试和扩展所提供的算法。
从研究论文中理解和实施新算法。

要求

熟悉 Python 编程
完成我们的课程“强化学习初学者到掌握”或熟悉强化学习的基础知识（或观看本课程中包含的练级部分）。
了解基本统计数据（均值、方差、正态分布）

说明

这是 Udemy 上最完整的高级强化学习课程。在其中，你将学习使用 PyTorch 和 PyTorch 闪电在 Python 中实现一些最强大的深度强化学习算法。你将从头开始实施根据经验解决控制任务的自适应算法。你将学习将这些技术与神经网络和深度学习方法相结合，以创建能够解决决策任务的自适应人工智能代理。

本课程将向你介绍强化学习技术的最新技术。它还将为你准备本系列的下一个课程，我们将在其中探索在其他类型的任务中表现出色的其他高级方法。

该课程的重点是培养实践技能。因此，在学习了每个方法家族最重要的概念之后，我们将从头开始在 jupyter notebook 中实现它们的一种或多种算法。

调平模块：

– 复习：马尔可夫决策过程 (MDP)。

– 复习：Q-Learning。

– 复习：神经网络简介。

– 复习：深度 Q 学习。

– 复习：策略梯度方法

高级强化学习：

– PyTorch 闪电。

– 使用 Optuna 进行超参数调整。

– 连续动作空间的深度 Q 学习（归一化优势函数 – NAF）。