2020
10-30
10-30
python使用selenium爬虫知乎的方法示例
说起爬虫一般想到的情况是,使用python中都通过requests库获取网页内容,然后通过beautifulSoup进行筛选文档中的标签和内容。但是这样有个问题就是,容易被反扒机制所拦住。反扒机制有很多种,例如知乎:刚开始只加载几个问题,当你往下滚动时才会继续往下面加载,而且在往下滚动一段距离时就会出来一个登陆的弹框。这样的机制对于通过获取服务器返回内容的爬虫方式进行了限制,我们只能获得前几个回答,而没办法或许后面的...
继续阅读 >