2021 年数据科学 Web 抓取 API | PostgreSQL+Excel
从初学者到高级 | 4 个实践项目
讲师:Dr. Alexander Schlee
双语IT资源独家Udemy付费课程,独家中英文字幕,配套资料齐全!
用不到1/10的价格,即可享受同样的高品质课程,且可以完全拥有,随时随地都可以任意观看和分享。
您将学到什么
- 网页抓取
- 数据提取
- 数据挖掘
- 创建自己的数据集
- 在 Excel 中输出数据
- 在 PostgreSQL 中输出数据框
- 在数据框上运行 SQL 命令
探索相关主题
- 网页抓取
- 其他 IT 和软件
- 信息技术与软件
要求
- 对 Python 编程有基本了解
描述
在本课程中,学生将了解如何从网站的 API(如果可用)中抓取数据。我们从基础知识和初级项目开始。之后,将介绍两个不同的项目,然后介绍高级项目。抓取每个项目的数据后,结果将存储在 Excel 文件中。在高级项目中,我们将创建两个不同的数据集,每个数据集包含 5000 个结果。目标是合并两个数据框(总计:10000 个结果),将其保存在 Excel 中,并将数据输出到 PostgreSQL 数据库中,然后对我们自己的数据运行 SQL 命令。
本课程要求您具备 Python 编程的基本知识。由于我们不会涉及非常困难的 Python 主题,因此您不必是专业人士。最重要的特点是您对 Web 抓取和数据挖掘充满好奇。您应该准备好投入时间来获取本课程所教授的知识。
完成本课程后,您将拥有抓取自己的数据和创建自己的数据集的知识和经验。借助课程资源,您将始终拥有可以参考的文档。如果您有疑问或某个概念对您来说毫无意义,您可以随时在问答论坛中提问。讲师或其他学生都会回答您的问题。感谢社区,您永远不会有独自学习的感觉。
免责声明:我以导师身份教授网页抓取技术,仅供教育目的。就是这样。
抓取网页的第一条规则是:不要损害某个网站。网页爬取的第二条规则是:不要损害某个网站。
本课程适合哪些人:
- 想要创建自己的数据集的数据爱好者
如果你有能力,请务必支持课程的原创作者,这是他们应得的报酬!
本站收取的费用,仅用来维持网站正常运行的必要支出,从本站下载任何内容,说明你已经知晓并同意此条款。