Databricks – 为数据工程师掌握 Azure Databricks
使用 PySpark 和 Spark SQL 为专业数据工程师学习 Azure Databricks
讲师:Learning Journal
双语IT资源独家Udemy付费课程,独家中英文字幕,配套资料齐全!
用不到1/10的价格,即可享受同样的高品质课程,且可以完全拥有,随时随地都可以任意观看和分享。
你将学到什么
- Azure 云中的 Databricks
- 使用 DBFS 和安装存储
- Unity 目录 – 配置和工作
- Unity 目录用户配置和安全
- 使用 Delta Lake 和 Delta Tables
- 手动和自动模式演化
- 增量摄取 Lakehouse
- Databricks 自动加载器
- Delta 实时表和 DLT 管道
- Databricks 存储库和 Databricks 工作流程
- Databricks Rest API 和 CLI
- 顶点项目
在你的职业生涯中蓬勃发展
通过订阅个人计划,访问一系列针对热门角色精心策划的顶级课程。
非常适合
数据工程师
精选的课程和实践练习集合,可帮助您成为数据工程师。
- 30+相关课程
- 140+动手练习
- 4.5平均。课程评级
免费试用个人计划试用后每月起价 20.00 美元。随时取消。
要求
- Python编程语言
- 使用 Python 的 Apache Spark 和 Dataframe API
- 使用 Python 的 Spark 结构化流 API
描述
关于课程
我正在使用 Azure 云平台创建Databricks – 为数据工程师掌握 Azure Databricks 。 本课程 将帮助您学习以下内容。
- Azure 云中的 Databricks
- 使用 DBFS 和安装存储
- Unity 目录 – 配置和工作
- Unity 目录用户配置和安全
- 使用 Delta Lake 和 Delta Tables
- 手动和自动模式演化
- 增量摄取 Lakehouse
- Databricks 自动加载器
- Delta 实时表和 DLT 管道
- Databricks 存储库和 Databricks 工作流程
- Databricks Rest API 和 CLI
顶点项目
本课程还包括一个端到端顶点项目。该项目将帮助您了解现实项目设计、编码、实施、测试和 CI/CD 方法。
谁应该学习本课程?
我为愿意使用 Databrick 云平台按照 Medallion 架构方法开发 Lakehouse 项目的数据工程师设计了本课程。我还为负责设计和构建组织的 Lakehouse 平台基础设施的数据和解决方案架构师创建本课程。另一类人是不直接参与 Lakehouse 实施的经理和架构师。尽管如此,他们还是与那些在底层实施 Lakehouse 的人合作。
课程中使用的 Spark 版本。
本课程使用Azure Cloud 中的 Databricks和Apache Spark 3.5。我已使用 Databricks Runtime 13.3在 Azure Databricks Cloud 上测试了本课程中使用的所有源代码和示例。
本课程适合谁:
- 数据工程师
- 数据工程解决方案架构师
如果你有能力,请务必支持课程的原创作者,这是他们应得的报酬!
本站收取的费用,仅用来维持网站正常运行的必要支出,从本站下载任何内容,说明你已经知晓并同意此条款。