Scrapy网络爬虫实战
上QQ阅读APP看书,第一时间看更新

第2章
爬虫基础知识

从本章开始,正式进入Python爬虫的开发讲解。本章分为两部分:第一部分是网络爬虫(本书也称爬虫)原理的概述,帮助读者了解网络爬虫;第二部分介绍网络爬虫开发中常用的一些分析方法及工具,分析方法包括网页内容及网络请求两方面,常用工具则包含Python基本的HTTP类库及本书主要介绍的Scrapy爬虫框架。

本章的主要知识点有:

  •  爬虫的基本原理
  •  爬虫的通用框架
  •  HTML页面分析
  •  爬虫常用工具