【Udemy中英字幕】Python Reinforcement Learning, Deep Q-Learning and TRFL
最近更新 2023年06月26日
资源编号 40795

【Udemy中英字幕】Python Reinforcement Learning, Deep Q-Learning and TRFL

2023-06-26 Udemy 0 235
郑重承诺丨视频 中英文字幕 配套课件
增值服务:免费提供代找课服务:
¥ 39.9 金币
VIP折扣
    折扣详情
  • 体验会员

    免费

  • 包月会员

    免费

  • 包年会员

    免费

  • 永久会员

    免费

开通VIP尊享优惠特权
立即下载 升级会员
微信扫码咨询 微信扫码咨询
进入TA的商铺 联系官方客服
信息属性
详情介绍

Python 强化学习、深度 Q 学习和 TRFL

利用强化学习技术的力量,使用 Python 开发智能系统

讲师:Packt Publishing

双语IT资源独家Udemy付费课程独家中英文字幕配套资料齐全!

不到1/10的价格,即可享受同样的高品质课程,且可以完全拥有,随时随地都可以任意观看和分享。

你将学到什么

  • 从基础开始实施最先进的强化学习算法
  • 探索强化学习的各种技术,例如 MDP、Q Learning 等
  • 深入研究时差学习,这是一种结合了蒙特卡罗方法和动态规划的算法
  • 使用 Deep Q-Learning 创建虚拟自动驾驶汽车应用程序
  • 使用 TensorFlow 和 OpenAI 健身房教授强化学习模型玩游戏
  • 使用 TRFL 和 TensorFlow 构建项目,并将必要的 RL 构建块集成到现有代码中
  • 发现 RL 算法的改进,例如带有 TRFL 块的 DQN 和 DDPG,例如高级目标网络更新、双 Q 学习和分布式 Q 学习
  • 修改 RL 代理以包含多步奖励技术,例如 TD lambda
  • 使用 TD Learning、Q Learning 和 SARSA 等经典 RL 方法创建基于 TRFL 的 RL 代理

要求

  • 需要具备 Python 基础知识。

描述

强化学习 (RL) 可让您在业务环境中开发智能、快速和自学习的系统。它是训练学习代理并解决人工智能中的各种问题的有效方法——从游戏、自动驾驶汽车和机器人到企业应用程序,范围从数据中心节能(冷却数据中心)到智能仓储解决方案。

本课程涵盖通过将深度神经网络架构与强化学习相结合,在深度强化学习方面取得的主要进展和成功。您将了解强化学习的概念、其优点以及它为何如此受欢迎。本课程还讨论马尔可夫决策过程 (MDP)、蒙特卡洛树搜索、动态规划(例如策略和值迭代)、时间差异学习(例如 Q-learning 和 SARSA)。您将学习使用 TensorFlow 和 Keras 构建卷积神经网络模型。您还将在 OpenAI Gym 的帮助下学习人工智能在游戏环境中的使用。

在本课程结束时,您将探索强化学习,并获得使用真实数据和人工智能 (AI) 构建智能系统的实践经验。

认识您的专家:

我们拥有以下受人尊敬的作者的最佳作品,以确保您的学习之旅顺利:

劳伦·华盛顿目前是 AI 驱动型初创公司 smartQED 的首席数据科学家和机器学习开发人员。Lauren 曾担任 Topix 的数据科学家、Google 的支付风险策略师(Google Wallet/Android Pay)、Nielsen 的统计分析师以及芝加哥大学国家民意研究中心的大数据实习生。劳伦还热衷于教授机器学习。她目前作为 Thinkful 数据科学训练营导师和 Packt Publishing 技术视频审阅者回馈数据科学界。她还获得了旧金山大会颁发的数据科学证书(2016 年)、哥伦比亚大学社会科学定量方法(应用统计方法)硕士学位(2012 年)以及斯佩尔曼学院经济学学士学位(2010 年)。劳伦是硅谷人工智能领域的领导者,

● Kaiser Hamid Rabbi是一位数据科学家,对人工智能、机器学习和数据科学充满热情。在过去的四年里,他全身心投入学习大数据科学技术,如Python、机器学习、深度学习、人工智能、强化学习、数据挖掘、数据分析、推荐系统等。Kaiser 对 Lygometry(我们知道我们不知道的事情!)也有着巨大的兴趣,并且总是尝试根据他的项目经验尽可能地理解领域知识。

● Colibri Digital 是一家技术咨询公司,由 James Cross 和 Ingrid Funie 于 2015 年创立。该公司致力于帮助客户驾驭快速变化且复杂的新兴技术世界,在大数据、数据科学、机器学习和云计算等领域拥有深厚的专业知识。在过去的几年里,他们与一些世界上最大和最负盛名的公司合作,包括一家一级投资银行、一家领先的管理咨询集团以及世界上最受欢迎的软饮料公司之一,帮助他们每个人更好地发展理解其数据,并以更智能的方式处理它。该公司的座右铭是:数据 -> 智能 -> 行动。

● Jim DiLorenzo是一名自由程序员和强化学习爱好者。他毕业于哥伦比亚大学,正在攻读计算机科学硕士学位。他在自己的 RL 实验以及将科学论文转化为代码时使用了 TRFL。

本课程适合谁:

  • 本课程专为人工智能工程师、机器学习工程师、有抱负的强化学习和数据科学专业人士而设计,他们热衷于使用 Python 将他们的技能扩展到强化学习。
请注意:
如果你有能力,请务必支持课程的原创作者,这是他们应得的报酬!
本站收取的费用,仅用来维持网站正常运行的必要支出,从本站下载任何内容,说明你已经知晓并同意此条款。

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务