Python 中的 Web 抓取和 API 基础知识
学习使用 Beautiful Soup 和 request-html 进行网页抓取;尽可能利用 API;自动化数据收集!
讲师:365 Careers
双语IT资源独家Udemy付费课程,独家中英文字幕,配套资料齐全!
用不到1/10的价格,即可享受同样的高品质课程,且可以完全拥有,随时随地都可以任意观看和分享。
您将学到什么
- 了解网页抓取的基础知识
- 在您的应用程序中实现 API
- 大师与Beautiful Soup合作
- 开始使用 request-html
- 创建功能齐全的抓取工具
- 抓取 JavaScript
- 熟悉 HTML
- 掌握 CSS 选择器
- 发出 HTTP 请求
- 了解网站 cookies
- 探索抓取登录系统锁定的内容
- 限制请求速率
探索相关主题
- 网页抓取
- 其他 IT 和软件
- 信息技术与软件
要求
- Python 3 和 Anaconda 发行版
- 基本 Python 知识
- 学习和实践的好奇心和热情
描述
您是否厌倦了在电子表格中手动复制和粘贴值?
您想学习如何使用简单的脚本从互联网上获取有趣、实时甚至罕见的信息吗?
您是否渴望获得一项宝贵的技能,以在这个数据驱动的世界中保持竞争领先地位?
如果答案是肯定的,那么您来对地方了!
欢迎来到Python 中的 Web 抓取和 API 基础知识!
关于数据收集的权威课程!
Web Scraping是一种通过使用智能自动化程序从网页或其他数据源(如API)获取信息的技术。Web Scraping 允许我们用几行代码从数百或数千个页面收集数据。
从报告到数据科学,自动从网络提取数据可避免重复工作。例如,如果您曾在一家严肃的组织工作过,您肯定知道报告是一个反复出现的话题。有每日、每周、每月、每季度和每年的报告。无论他们的目的是组织网站数据、交易数据、客户数据,还是天气预报等更简单的信息——报告在当今世界都是不可或缺的。虽然有时实习生的工作就是处理这些事情,但很少有任务比报告自动化更节省成本。
说到数据科学,越来越多的数据来自外部来源,如网页、可下载文件和 API。了解如何快速提取和构建数据是一项必不可少的技能,它将让你在就业市场中脱颖而出。
是的,现在是时候提高你的水平并学习如何自动使用 API 以及从网站提取有用的信息了。
在课程的第一部分,我们从API开始。API 专门用于向开发人员提供数据,因此它们是搜索数据时要首先检查的地方。我们将了解 GET 请求、POST 请求和 JSON 格式。
这些概念都通过有趣的例子以直截了当的方式进行了探索。
但有时,信息可能无法通过 API 获取,但包含在网页中。在这种情况下我们能做什么?访问页面并手动记下数据?
请永远不要这样做!
我们将学习如何利用强大的库(例如“ Beautiful Soup ”和“ requests HTML ”)来抓取任何网站的数据,无论使用哪种语言组合 – HTML、JavaScript 和 CSS。
当然,为了进行抓取,您需要了解一些有关 Web 开发的知识。这就是为什么我们还包含了一个可选部分,涵盖HTML的基础知识。将其视为您将获得的所有知识的额外奖励!
我们还将探索几个抓取项目。我们将从“烂番茄”排名列表中获取并构建有关电影的数据,详细检查该过程的每个步骤。这将帮助您了解现实世界中的抓取是什么样子。
我们还将讨论如何同时从多个网页抓取数据,这是数据提取时常见的需求。
然后,您将通过我们为您设置的几个项目来实践所学到的知识。
但还有更多!
Web 抓取并不总是按计划进行(毕竟,这就是您参加本课程的原因)。不同的网站以不同的方式构建,我们的机器人经常会受到阻碍。因此,我们将付出额外的努力来探索您在抓取时可能遇到的常见障碍,并向您介绍绕过或处理这些问题的方法。这些包括请求标头和cookie、登录系统和JavaScript 生成的内容。
如果您对这些术语知之甚少或一无所知,请不要担心……我们将从基础开始,逐步精通。此外,我们坚信熟能生巧,因此本课程不太注重理论方面,而是采用更多的实践方法。此外,它包含大量家庭作业练习、可下载的文件和笔记本,以及测验问题和课程笔记。
我们 365 数据科学团队致力于为您(我们的学生)提供最高质量的内容。虽然我们喜欢在内部创建内容,但这次我们决定与真正的行业专家Andrew Treadway 合作。Andrew 是纽约人寿保险公司的高级数据科学家。他拥有佐治亚理工学院的计算机科学和机器学习硕士学位,是一位出色的专业人士,在数据相关的 Python 编程方面拥有 7 年以上的经验。他还是“yahoo_fin”包的作者,该包广泛用于从雅虎抓取历史股价数据。
与我们所有的课程一样,如果您在某个时候认为该培训不是最适合您的,您可以享受 30 天退款保证。所以……您不会有任何损失——反而会收获一切?
那么,您还在等什么?
点击‘立即购买’按钮,让我们一起开始收集数据!
本课程适合哪些人:
- 如果你想学习如何使用 API,你应该参加本课程
- 如果你想学习如何抓取网站数据,本课程适合你
- 任何想学习如何自动执行枯燥乏味的日常任务的人
- 对数据充满好奇和热情的个人
- 本课程非常适合想要学习 Beautiful Soup 和 request-html 的编程初学者
如果你有能力,请务必支持课程的原创作者,这是他们应得的报酬!
本站收取的费用,仅用来维持网站正常运行的必要支出,从本站下载任何内容,说明你已经知晓并同意此条款。