2020
10-28
10-28
python 爬虫基本使用——统计杭电oj题目正确率并排序
python爬虫主要用两个库:Urllib和BeautifulSoup4。一个用来爬取网页,一个用来解析网页。Urllib是Python内置的HTTP请求库,它包含四个模块:1、request,最基本的HTTP请求模块,用来模拟发送请求,就像在浏览器里输入网址然后敲击回车一样,只需要给库方法传入URL与额外的参数,就可以模拟这个过程。2、error,异常处理模块,如果出现请求错误,我们可以捕获这些异常,然后进行重试或其他操作保证程序不会意...
继续阅读 >