2021
09-10
09-10
python解析PDF程序代码
说在前面和word的文本相比PDF更类似于一张张图片,图上放着一个个文字。对其的解析是将图片上的文字提取到text文件中,方便之后的分析。添加依赖在python的环境中安装PDFminer3k,不要装错了,一开始我装的是PDFminer,结果有几个包不能用pipinstallpdfminer3k源程序代码#!/usr/bin/envpython3#-*-coding:utf-8-*-#pip3installpdfminer3kimportosfrompdfminer.converterimportPDFPageAggregatorfrompdfminer.layout...
继续阅读 >