202205-27 教你快速上手Selenium爬虫,万物皆可爬 目录一、基本使用二、查找节点2.1查找单个节点2.2查找多个节点三、节点交互四、动作链五、执行JavaScript代码六、获取节点信息七、管理Cookies八、改变节点属性的值一、基本使用selenium的基本使用步骤:打开浏览器;获取浏览器页面的特定内容;控制浏览器页面上的控件,如向一个文本框中输入一个字符串;关闭浏览器。示例:fromseleniumimportwebdriverfromselenium.webdriver.common.keysimportKeys... 继续阅读 >
202010-30 python使用selenium爬虫知乎的方法示例 说起爬虫一般想到的情况是,使用python中都通过requests库获取网页内容,然后通过beautifulSoup进行筛选文档中的标签和内容。但是这样有个问题就是,容易被反扒机制所拦住。反扒机制有很多种,例如知乎:刚开始只加载几个问题,当你往下滚动时才会继续往下面加载,而且在往下滚动一段距离时就会出来一个登陆的弹框。这样的机制对于通过获取服务器返回内容的爬虫方式进行了限制,我们只能获得前几个回答,而没办法或许后面的... 继续阅读 >
202010-06 Python selenium爬虫实现定时任务过程解析 现在需要启动一个selenium的爬虫,使用火狐驱动+多线程,大家都明白的,现在电脑管家显示CPU占用率20%,启动selenium后不停的开启浏览器+多线程,好,没过5分钟,CPU占用率直接拉到90%+,电脑卡到飞起,定时程序虽然还在运行,但是已经类似于待机状态,是不是突然感觉到面对电脑卡死,第一反应:卧槽,这个lj电脑,这么程序都跑不起来,我还写这么多代码,*****!!是吧,接下来上代码,具体功能,请自信查阅相关资料深造:fromda... 继续阅读 >