2021
06-04
06-04
python中requests库+xpath+lxml简单使用
python的requests它是python的一个第三方库,处理URL比urllib这个库要方便的多,并且功能也很丰富。【可以先看4,5表格形式的说明,再看前面的】安装直接用pip安装,anconda是自带这个库的。pipinstallrequests简单使用requests的文档1.简单访问一个url:importrequestsurl='http://www.baidu.com'res=requests.get(url)res.textres.status_code<!DOCTYPEhtml><!--STATUSOK--><html><head><metahttp-equiv=content-typec...
继续阅读 >
字典与json字符串区别#python中的字典格式,是dict类型{'a':'sd'}如果声明a={"a":"sd"},它仍是字典,不过python会默认将双引号换成单引号,最后打印的仍然为{'a':'sd'}#python中的json字符串,是str类型{"a":"sd"}两者差别在于引号在爬虫的过程中有些请求参数是json字符串的,有的是字典类型的,要区分json字符串和字典json字符串格式如点击viewsource很显然是json字符串格式的,字典转json字符串可以用json.dumps()函数...
requests库利用pip安装:pipinstallrequests基本请求req=requests.get("https://www.baidu.com/")req=requests.post("https://www.baidu.com/")req=requests.put("https://www.baidu.com/")req=requests.delete("https://www.baidu.com/")req=requests.head("https://www.baidu.com/")req=requests.options(https://www.baidu.com/)1.get请求参数是字典,我们可以传递json类型的参数:importrequestsfromfake_usera...
requests是python实现的简单易用的HTTP库,使用起来比urllib简洁很多因为是第三方库,所以使用前需要cmd安装pipinstallrequests安装完成后import一下,正常则说明可以开始使用了。基本用法:requests.get()用于请求目标网站,类型是一个HTTPresponse类型importrequestsresponse=requests.get('http://www.baidu.com')print(response.status_code)#打印状态码print(response.url)#打印请求urlprint(response.headers)#打...