2021
05-19
05-19
Java使用Tesseract-Ocr识别数字
前言Tesseract-Ocr是我在编写爬虫项目中,用来识别图片(不是验证码)的本地解决方案(因为客户不想使用API识别,太贵),识别率目前达到了100%,可以说是相当了得,当然了,这取决于使用的traineddata。简介Tesseract最初是在1985年至1994年间在Hewlett-PackardLaboratoriesBristol和GreeleyColorado的Hewlett-PackardCo开发的,1996年进行了一些更改,移植到Windows,并且随着C++在1998年兴起。2005年Tesseract由惠普开源,...
继续阅读 >