2021
02-01
02-01
python多线程爬取西刺代理的示例代码
西刺代理是一个国内IP代理,由于代理倒闭了,所以我就把原来的代码放出来供大家学习吧。镜像地址:https://www.blib.cn/url/xcdl.html首先找到所有的tr标签,与class="odd"的标签,然后提取出来。然后再依次找到tr标签里面的所有td标签,然后只提取出里面的[1,2,5,9]这四个标签的位置,其他的不提取。最后可以写出提取单一页面的代码,提取后将其保存到文件中。importsys,re,threadingimportrequests,lxmlfromqueueimportQueu...
继续阅读 >