202106-04 Python爬虫进阶之Beautiful Soup库详解 一、BeautifulSoup库简介BeautifulSoup4是一个HTML/XML的解析器,主要的功能是解析和提取HTML/XML的数据。和lxml库一样。lxml只会局部遍历,而BeautifulSoup4是基于HTMLDOM的,会加载整个文档,解析整个DOM树,因此内存开销比较大,性能比较低。BeautifulSoup4用来解析HTML比较简单,API使用非常人性化,支持CSS选择器,是Python标准库中的HTML解析器,也支持lxml解析器。二、BeautifulSoup库安装目... 继续阅读 >