【Udemy中英字幕】Google Cloud Certified Professional Data Engineer
最近更新 2024年03月24日
资源编号 36731

【Udemy中英字幕】Google Cloud Certified Professional Data Engineer

2024-03-24 IT与软件 0 303
郑重承诺丨视频 中英文字幕 配套课件
增值服务:免费提供代找课服务:
¥ 49.9 金币
VIP折扣
    折扣详情
  • 体验会员

    免费

  • 包月会员

    免费

  • 包年会员

    免费

  • 永久会员

    免费

开通VIP尊享优惠特权
立即下载 升级会员
微信扫码咨询 微信扫码咨询
进入TA的商铺 联系官方客服
信息属性
详情介绍

Google Cloud 认证专业数据工程师

理论、实践和 252 个问题、答案和解释。所有实践均采用一键复制粘贴方式。 PDF下载

讲师:Deepak Dubey

双语IT资源独家Udemy付费课程独家中英文字幕配套资料齐全!

不到1/10的价格,即可享受同样的高品质课程,且可以完全拥有,随时随地都可以任意观看和分享。

你将学到什么

  • 设计数据处理系统
  • 构建和运行数据处理系统
  • 机器学习模型的可操作性
  • 确保解决方案质量
  • 设计数据管道
  • 设计数据处理解决方案
  • 迁移数据仓库和数据处理
  • 构建和运行存储系统
  • 建设和运营管道
  • 构建和运行处理基础设施
  • 利用预构建的 ML 模型作为服务
  • 部署 ML 管道
  • 机器学习模型的测量、监控和故障排除
  • 安全性和合规性设计
  • 确保可扩展性和效率
  • 确保可靠性和保真度
  • 确保灵活性和便携性

要求

  • 本课程将涵盖您通过 Google Cloud 认证专业数据工程师所需的一切

描述

设计数据处理系统

选择适当的存储技术。考虑因素包括:

● 将存储系统映射到业务需求

● 数据建模

● 涉及延迟、吞吐量、事务的权衡

● 分布式系统

● 架构设计

设计数据管道。考虑因素包括:

● 数据发布和可视化(例如BigQuery)

● 批处理和流数据(例如Dataflow、Dataproc、Apache Beam、Apache Spark 和Hadoop 生态系统、Pub/Sub、Apache Kafka)

● 在线(交互式)预测与批量预测

● 作业自动化和编排(例如,Cloud Composer)

设计数据处理解决方案。考虑因素包括:

● 基础设施的选择

● 系统可用性和容错能力

● 分布式系统的使用

● 容量规划

● 混合云和边缘计算

● 架构选项(例如,消息代理、消息队列、中间件、面向服务的架构、无服务器功能)

● 至少一次、有序、恰好一次等事件处理

迁移数据仓库和数据处理。考虑因素包括:

● 了解当前状态以及如何将设计迁移到未来状态

● 从本地迁移到云(数据传输服务、传输设备、云网络)

● 验证迁移

构建和运行数据处理系统

构建和运行存储系统。考虑因素包括:

● 有效使用托管服务(Cloud Bigtable、Cloud Spanner、Cloud SQL、BigQuery、Cloud Storage、Datastore、Memorystore)

● 存储成本和性能

● 数据的生命周期管理

建设和运营管道。考虑因素包括:

● 数据清洗

● 批量和流式传输

● 转型

● 数据采集与导入

● 与新数据源集成

建设和运行处理基础设施。考虑因素包括:

● 配置资源

● 监控管道

● 调整管道

● 测试和质量控制

机器学习模型的可操作性

利用预构建的 ML 模型作为服务。考虑因素包括:

● ML API(例如视觉API、语音API)

● 自定义ML API(例如AutoML Vision、Auto ML 文本)

● 对话体验(例如Dialogflow)

部署机器学习管道。考虑因素包括:

● 摄取适当的数据

● 机器学习模型的再训练(AI Platform Prediction and Training、BigQuery ML、Kubeflow、Spark ML)

● 持续评估

选择适当的培训和服务基础设施。考虑因素包括:

● 分布式与单机

● 边缘计算的使用

● 硬件加速器(例如GPU、TPU)

测量、监控机器学习模型并排除故障。考虑因素包括:

● 机器学习术语(例如特征、标签、模型、回归、分类、推荐、监督和无监督学习、评估指标)

● 机器学习模型依赖性的影响

● 常见的错误来源(例如,对数据的假设)

确保解决方案质量

为安全性和合规性而设计。考虑因素包括:

● 身份和访问管理(例如,Cloud IAM)

● 数据安全(加密、密钥管理)

● 确保隐私(例如,数据丢失防护 API)

● 法律合规性(例如,健康保险流通与责任法案 (HIPAA)、儿童在线隐私保护法案 (COPPA)、FedRAMP、通用数据保护条例 (GDPR))

确保可扩展性和效率。考虑因素包括:

● 构建和运行测试套件

● 管道监控(例如云监控)

● 评估、故障排除和改进数据表示和数据处理基础设施

● 调整资源大小和自动扩展资源

确保可靠性和保真度。考虑因素包括:

● 执行数据准备和质量控制(例如Dataprep)

● 验证和监控

● 规划、执行和压力测试数据恢复(容错、重新运行失败的作业、执行回顾性重新分析)

● 在 ACID、幂等、最终一致要求之间进行选择

确保灵活性和便携性。考虑因素包括:

● 映射当前和未来的业务需求

● 针对数据和应用程序可移植性进行设计(例如,多云、数据驻留要求)

● 数据暂存、编目和发现

本课程适合谁:

  • 初学者
  • 中间的
  • 先进的
请注意:
如果你有能力,请务必支持课程的原创作者,这是他们应得的报酬!
本站收取的费用,仅用来维持网站正常运行的必要支出,从本站下载任何内容,说明你已经知晓并同意此条款。

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务