2020
09-24
09-24
python-xpath获取html文档的部分内容
有些时候我在们需要的用正则提取出html中某一个部分的文字内容,如图:获取dd部分的html文档,我们要通过它的一个属性去确定他的位置才可以拿到他这个部分我们可以看到他的这个属性class='rowclearfix',然后用xpath去获取到这部分:name=tree.xpath("//dd[@class='rowclearfix']")fromlxmlimporthtmlimportrequestsurl='http://navi.cnki.net/knavi/JournalDetail/GetArticleList?year=2018&issue=04&pykm=DZXU&pag...
继续阅读 >