【Udemy中英字幕】Advanced Reinforcement Learning in Python: from DQN to SAC
最近更新 2022年08月25日
资源编号 43712

【Udemy中英字幕】Advanced Reinforcement Learning in Python: from DQN to SAC

2022-08-25 Udemy 0 165
郑重承诺丨视频 中英文字幕 配套课件
增值服务:免费提供代找课服务:
¥ 49.9 金币
VIP折扣
    折扣详情
  • 体验会员

    免费

  • 包月会员

    免费

  • 包年会员

    免费

  • 永久会员

    免费

开通VIP尊享优惠特权
立即下载 升级会员
微信扫码咨询 微信扫码咨询
进入TA的商铺 联系官方客服
信息属性
详情介绍

Python 中的高级强化学习:从 DQN 到 SAC

使用深度强化学习和 PyTorch 构建人工智能 (AI) 代理:DDPG、TD3、SAC、NAF、HER

讲师:Escape Velocity Labs

双语IT资源独家Udemy付费课程独家中英文字幕配套资料齐全!

不到1/10的价格,即可享受同样的高品质课程,且可以完全拥有,随时随地都可以任意观看和分享。

你将会学到的

  • 掌握一些最先进的强化学习算法。
  • 了解如何创建可以在复杂环境中行动以实现其目标的 AI。
  • 使用 Python 最流行的工具(PyTorch Lightning、OpenAI gym、Brax、Optuna)从头开始创建高级强化学习代理
  • 了解如何执行超参数调整(为我们的 AI 学习选择最佳实验条件)
  • 从根本上了解每种算法的学习过程。
  • 调试和扩展所提供的算法。
  • 从研究论文中理解和实施新算法。

要求

  • 熟悉 Python 编程
  • 完成我们的课程“强化学习初学者到掌握”或熟悉强化学习的基础知识(或观看本课程中包含的练级部分)。
  • 了解基本统计数据(均值、方差、正态分布)

说明

这是 Udemy 上最完整的高级强化学习课程。在其中,你将学习使用 PyTorch 和 PyTorch 闪电在 Python 中实现一些最强大的深度强化学习算法。你将从头开始实施根据经验解决控制任务的自适应算法。你将学习将这些技术与神经网络和深度学习方法相结合,以创建能够解决决策任务的自适应人工智能代理。

本课程将向你介绍强化学习技术的最新技术。它还将为你准备本系列的下一个课程,我们将在其中探索在其他类型的任务中表现出色的其他高级方法。

该课程的重点是培养实践技能。因此,在学习了每个方法家族最重要的概念之后,我们将从头开始在 jupyter notebook 中实现它们的一种或多种算法。

调平模块: 

– 复习:马尔可夫决策过程 (MDP)。

– 复习:Q-Learning。

– 复习:神经网络简介。

– 复习:深度 Q 学习。

– 复习:策略梯度方法

高级强化学习:

– PyTorch 闪电。

– 使用 Optuna 进行超参数调整。

– 连续动作空间的深度 Q 学习(归一化优势函数 – NAF)。

– 深度确定性策略梯度 (DDPG)。

– 双延迟 DDPG (TD3)。

– 软演员-评论家 (SAC)。

– 事后经验回放 (HER)。

此课程面向哪些人:

  • 想要在机器学习领域找到工作的开发人员。
  • 寻求扩展知识广度的数据科学家/分析师和机器学习从业者。
  • 机器人专业的学生和研究人员。
  • 工科学生和研究人员。
请注意:
如果你有能力,请务必支持课程的原创作者,这是他们应得的报酬!
本站收取的费用,仅用来维持网站正常运行的必要支出,从本站下载任何内容,说明你已经知晓并同意此条款。

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务