DuckDB – 终极指南
掌握 DuckDB:未来的分析数据库。7 个实践项目 + 理论,助您精通 DuckDB Python、Streamlit、CLI 和 Docker
讲师:Max Migutin
双语IT资源独家Udemy付费课程,独家中英文字幕,配套资料齐全!
用不到1/10的价格,即可享受同样的高品质课程,且可以完全拥有,随时随地都可以任意观看和分享。
您将学到什么
- 构建并实施使用 DuckDB 作为数据库的分析解决方案
- 您将了解使 DuckDB 在任何机器上如此快速的底层原理(理论)
- 您将学习在 Python 环境中使用 DuckDB(实践)
- 您将学习从 CLI(命令行)环境使用 DuckDB(实践)
- 使用 DuckDB 作为 Streamlit Python 分析应用程序的后端数据库(实践)
- 将 DuckDB 与 dbt(数据构建工具)结合起来简化分析数据仓库开发(实践)
- 您将学习如何在 MotherDuck 中工作:DuckDB 的云原生环境 (SaaS)(实践)
- 您将了解 DuckDB 与其他数据库的不同之处:分析数据库(Clickhouse、Redshift、Cassandra)和 OLTP 数据库(PostgreSQL、SQLITE)
探索相关主题
- 数据库管理系统 (DBMS)
- 数据库设计与开发
- 发展
要求
- 基本 SQL 有帮助,但不是必需的(我们将使用提供的指南)
- Python 基础
- 笔记本电脑或台式电脑
描述
我为什么要学习 DuckDB?
-
+ 过去 2 年中的搜索量增长了 1200%
它的受欢迎程度正在迅速增长! -
数据湖和庞大的大数据基础设施(如 Apache Hadoop 和 Spark)并不是每个数据问题的最佳解决方案
DuckDB 是一个非常棒的解决方案,可以运行与 PostgreSQL 非常相似的数据库,但具有强大的分析能力,在本地运行没有任何麻烦
-
100%免费并支持数十种不同的集成
duckdb Python、duckdb dbt、duckdb Streamlit、duckdb s3 & wasm & Docker + 还有很多:您几乎可以用它做任何事情。此外,您还可以轻松导出数据:duckdb csv、duckdb parquet、duckdb json 都是立即分享分析结果的方法!Python 集成就像执行“pip install duckdb”一样简单,您就可以开始了!我们将在其中一个案例中深入探讨 duckdb Python 集成。
-
易于使用
您无需为团队中的每个开发人员都配备一个 PostgreSQL/Mariadb,只需设置配置以生成 DuckDB 的内存实例即可。如果您需要从互联网获取数据,这也不是问题:Duckdb Httpfs 也是我们将要研究的一个包。 -
大数据的本地分析
如果您想在本地运行一个列式数据库来处理相当大的数据,那么实际上没有其他东西可以与之媲美。您也可以在本地运行 PySpark,但这会更麻烦。Duckdb Pivot 甚至可以帮助您创建类似电子表格的表格。 -
比 SQLite 更易于学习
这是从 SQLite 向分析领域迈出的一步。DuckDB 在对有限列运行聚合查询时表现良好,而 SQLite 在使用过滤器获取一行或多行时表现良好。在课程中,我们将比较和对比 duckdb 与 Sqlite 以及 duckdb 与 Clickhouse。 -
比 Pandas 快 300% 以上
Pandas 将所有数据加载到内存中并在单个线程上运行。因此,它无法对大于内存的数据集进行操作,也不会使用所有 CPU 核心。而 DuckDB 可以对大于内存的数据集进行操作。此外,它可以在所有 CPU 核心上分配负载。默认情况下,所有这些都使用 SQL 语言!
本课程不仅仅是一个 duckdb 教程:它是一个掌握这项新兴且快速发展的技术的打包解决方案。
预期成果
完成本课程后:
-
您将学习如何构建和实施使用 duck db 作为数据库的分析解决方案
-
您将了解使 DuckDB 在任何机器上如此快速的底层原理(理论)
-
您将了解 DuckDB与其他数据库的不同之处:分析型( Clickhouse、Redshift、Cassandra)和 OLTP(PostgreSQL、SQLite)
-
您将学习在Python环境中使用 DuckDB(实践)
-
您将学习从CLI(命令行)环境使用 DuckDB(实践)
-
使用DuckDB作为Streamlit Python分析应用程序的后端数据库(实践)
-
使用 DuckDB dbt(数据构建工具)组合简化分析数据仓库开发(实践)
-
您将学习如何在MotherDuck中工作:一个用于 duck db 的云原生环境 (SaaS)(实践)。您可以将其视为 CLI 中可能缺少的 DuckDB GUI
-
学习在Docker环境中与 DuckDB 交互
-
了解 DuckDB 如何适应分析服务的微服务架构
-
使用Rill:一个由 DuckDB 提供支持的BI-as-Code “最后一英里 ETL”平台,用于快速实现仪表板
里面有什么
-
视频讲座(带交互式注释)
-
包含实践案例大纲的 PDF
-
演示资源
-
为实践项目提供完整打包的代码库
-
获得所有未来更新的终身访问权限
-
课程结业证书
-
30 天退款保证
课程不是一成不变的!我会收集学生的反馈并努力改进课程
[课程更新]:
01.2024:+ 奖励部分:让我们构建一个由 DuckDB 提供支持的推荐微服务
02.2024:+“Rill Data”部分:由 DuckDB 提供支持的BI-as-Code “最后一英里 ETL”平台
05.2024:+ MotherDuck 部分更新:探索平台中新的 AI 功能
06.2024:+ “数据管道中的 DuckDB” 部分:使用案例了解 DuckDB 如何扮演“数据转换器”的角色
使用的数字资产:
-图片来自 freepik,免费许可来自 freepik dot com “免费矢量渐变动态蓝线背景”
本课程适合哪些人:
- 想要了解现代本地数据仓库并更快地开发分析解决方案的开发人员和数据工程师
- 希望提升技能并学习如何使用嵌入式分析数据库的数据分析师和数据科学家
- 希望提升数据库和数据建模技能的数据专业人士和爱好者
- 想要成为数据科学家、BI 分析师、数据工程师或数据分析师的人
如果你有能力,请务必支持课程的原创作者,这是他们应得的报酬!
本站收取的费用,仅用来维持网站正常运行的必要支出,从本站下载任何内容,说明你已经知晓并同意此条款。