2021
01-22
01-22
如何使用Python进行PDF图片识别OCR
使用场景使用图片识别可以快速提取图片中的信息,方便高效。Python并不能直接对PDF进行识别,所以如果是识别PDF的话,需要先将PDF转化为图片,然后再进行识别。必备工具Python 可以安装3.7及以上版本tesseract-ocr 下载地址: https://github.com/UB-Mannheim/tesseract/wiki 使用最新版本即可需要用到的库pipinstallpillowpipinstallopencv-pythonpipinstallfitzpipinstallPyMuPDFpipinst...
继续阅读 >