高级可观察性:真实世界的监控和日志记录
通过实践项目、真实场景以及 SRE、DevOps 和云的工作技能掌握可观察性。
讲师:DevOps Door Training
双语IT资源独家Udemy付费课程,独家中英文字幕,配套资料齐全!
用不到1/10的价格,即可享受同样的高品质课程,且可以完全拥有,随时随地都可以任意观看和分享。
您将学到什么
- 使用开源工具构建完整的可观察性堆栈——部署并集成 Prometheus 用于指标,Grafana/Loki 用于日志
- 从零开始搭建实时实验室:跟随从零开始搭建的实时实验室设置。拥有云账户后,您可以复制所有环境和体验。
- 利用可观察性数据诊断实际生产问题——通过关联日志、指标来练习排除复杂系统中的延迟、错误和故障
- 设计服务级别目标 (SLO) 和警报 – 定义可靠性目标 (SLO/错误预算) 并配置通知您问题的警报规则。
- 在云和 Kubernetes 环境中实现可观察性——监控容器化应用程序,使用 Kubernetes 事件日志和指标,并在 k8s 中部署
- 最佳实践和性能调整——学习高级技巧(优化日志级别、处理高基数指标以及最小化可观察性开销)
探索相关主题
要求
- DevOps 和容器的基础知识:熟悉 Docker 和基本的 DevOps 概念将有助于理解可观察性工具的部署
- 云计算基本知识:建议具备任何云服务提供商(AWS、Azure、GCP)的使用经验。你应该拥有免费套餐或个人云账户,用于可选的云端实验练习。
- Linux 命令行基础:需要具备在 Linux 终端上导航和运行简单命令的能力,因为许多工具都是在 Linux 上或通过 Docker 部署的。
- 先前的监控/记录经验(可选):监控或记录的基本经验(即使是初学者水平)也会有所帮助,但不是严格要求的——在深入探讨之前,我们将回顾基础知识。
- 硬件/软件:一台能够运行多个 Docker 容器的计算机(Windows/Mac/Linux),以及互联网连接。我们将在整个课程中使用免费/开源软件。
- 渴望通过实践来学习:愿意设置环境、试验配置和排除故障将极大地增强您在本实践课程中的学习体验。
描述
可观察性不仅仅是一个流行词,更是当今 SRE 和 DevOps 工程师的一项关键技能。“高级可观察性”是一门基于项目的课程,它超越了理论,让您沉浸在真实的场景中。在本课程中,您将有目的地构建和破坏事物:使用遥测技术检测应用程序,设置完整的可观察性堆栈,并像在工作中一样对复杂系统进行故障排除。我们的教学方法正式,但语气略带对话,使高级概念易于理解和理解。
在整个课程中,我们强调边做边学。每个模块都围绕一个真实的项目或问题场景展开——从调试微服务中断到在实际环境中优化性能。您不仅会学习相关定义或被动观看工具演示,还会在动手实验环境中主动实施日志和指标。通过指导性实验和挑战,您将能够自信地使用行业标准工具(例如 Prometheus、Grafana、Loki 等),并将它们整合到一个统一的可观测性平台中。
完成本课程后,您将掌握可投入实际工作的可观察性专业知识。您将了解如何主动监控分布式系统,快速定位复杂架构中的问题,并利用数据驱动的洞察提升可靠性。无论您的目标是在 SRE/DevOps 岗位上取得卓越成就,还是希望将可观察性的最佳实践带给您的团队,本课程都能提供实践经验,并将其直接转化为实际成功。准备好通过沉浸式项目提升您的技能,成为您组织中的可观察性领军人物!
本课程适合哪些人:
- 站点可靠性工程师 (SRE) 希望掌握可观察性的艺术并将其事件响应技能提升到一个新的水平。
- DevOps 工程师旨在在 CI/CD 管道和生产系统中实现全面的监控和跟踪。
- 软件开发人员希望了解他们的代码在生产中发生的情况以及如何对应用程序进行更好的可调试性。
- 系统管理员和 IT 运营人员希望使用日志、指标和警报主动检测和解决基础设施问题。
- 技术支持工程师负责解决生产问题并需要更深入地了解系统行为以更快地解决客户问题。
- 质量保证和测试工程师有兴趣在测试期间观察系统性能和可靠性,并学习如何使用可观察性数据来验证负载下的功能。
- 设计现代微服务或云原生架构的云架构师/工程师,他们需要大规模嵌入分布式系统的可观察性。
- 热情的学习者拥有基本的操作/开发经验,并渴望通过获得所需的可观察性技能进入 SRE、DevOps 或以可靠性为中心的角色。
如果你有能力,请务必支持课程的原创作者,这是他们应得的报酬!
本站收取的费用,仅用来维持网站正常运行的必要支出,从本站下载任何内容,说明你已经知晓并同意此条款。