2021
06-23
06-23
python基础之爬虫入门
前言python基础爬虫主要针对一些反爬机制较为简单的网站,是对爬虫整个过程的了解与爬虫策略的熟练过程。爬虫分为四个步骤:请求,解析数据,提取数据,存储数据。本文也会从这四个角度介绍基础爬虫的案例。一、简单静态网页的爬取我们要爬取的是一个壁纸网站的所有壁纸http://www.netbian.com/dongman/1.1选取爬虫策略——缩略图首先打开开发者模式,观察网页结构,找到每一张图对应的的图片标签,可以发现我们只要获取到标黄的i...
继续阅读 >