PYSPARK 端到端开发人员课程(Spark 与 Python)
学习 PySpark 端到端特性和功能。课程还包含 Python 课程和 HDFS 命令课程。
讲师:Sibaram Nanda
双语IT资源独家Udemy付费课程,独家中英文字幕,配套资料齐全!
用不到1/10的价格,即可享受同样的高品质课程,且可以完全拥有,随时随地都可以任意观看和分享。
您将学到什么
- PySpark 的完整开发功能和特性
- Spark 集群执行架构
- Spark SQL 架构
- Spark性能与优化
- Python课程
- HDFS课程
探索相关主题
进行简短评估以找到适合您的课程
回答 3 个问题即可获得您感兴趣的课程推荐查找更多课程
要求
- Python 基础知识。
- HDFS 命令。
- 该课程涵盖以上两个主题。
描述
Spark 简介。
HDFS 命令
Python 课程。
为什么要开发 Spark。
什么是 Spark 以及它的特点。
Spark 主要组件。
Spark 简介。
HDFS 命令
SparkSession简介
RDD基础知识
什么是 RDD
RDD 属性
何时使用 RDD
RDD 问题
创建 RDD
创建 RDD 的不同方法
RDD 操作
转换 – 低级
转换 – 连接类型
操作 – 总聚合
混洗和合并
转换 – 关键聚合
转换 – 排序
转型 – 排名
变换 – 设置
变换 – 采样
变换 – 分区
转换 – 重新分区
转换 – 重新分区和排序
转型——合并
转换 – 重新分区与合并
萃取
Spark集群执行架构_完整架构
Spark集群执行架构_YARN作为Spark集群管理器
Spark集群执行架构_跨集群的JVM
Spark集群执行架构-执行框架常用术语
Spark 集群执行架构 – 窄转换和宽转换
Spark集群执行架构-DAG调度器
Spark集群执行架构-任务调度
RDD 持久性
Spark共享变量
SparkSQL 架构
SparkSession功能详解
DataFrame 基础知识
数据类型
DataFrame 行
DataFrame 列
数据帧 ETL
DataFrame ETL_转换与提取简介
DataFrame ETL_DataFrame API介绍 提取
DataFrame ETL_DataFrame API 选择
DataFrame ETL_DataFrame API 过滤器或 Where
DataFrame ETL_DataFrame API 排序
DataFrame ETL_DataFrame API 集
DataFrame ETL_DataFrame API 连接
DataFrame ETL_DataFrame API 聚合
数据帧 ETL_DataFrame API 分组
数据帧 ETL_DataFrame API Windows
DataFrame ETL_DataFrame 内置函数介绍
性能和优化
本课程适合哪些人:
- 数据工程师
- 数据科学家
- 数据分析师
- 数据库开发人员
如果你有能力,请务必支持课程的原创作者,这是他们应得的报酬!
本站收取的费用,仅用来维持网站正常运行的必要支出,从本站下载任何内容,说明你已经知晓并同意此条款。