2020
09-24
09-24
Python基于requests库爬取网站信息
requests库是一个简介且简单的处理HTTP请求的第三方库get()是获取网页最常用的方式,其基本使用方式如下使用requests库获取HTML页面并将其转换成字符串后,需要进一步解析HTML页面格式,这里我们常用的就是beautifulsoup4库,用于解析和处理HTML和XML下面这段代码便是爬取百度的信息并简单输出百度的界面信息importrequestsfrombs4importBeautifulSoupr=requests.get('http://www.baidu.com')r.encoding=Noneresult=r.textbs=B...
继续阅读 >