2020
10-08
10-08
python实现PDF中表格转化为Excel的方法
这几天想统计一下《中国人文社会科学期刊AMI综合评价报告(2018年):A刊评价报告》中的期刊,但是只找到了该报告的PDF版,对于表格的编辑不太方便,于是想到用Python将表格转成Excel格式。看过别人写的博客,发现Python解析PDF有以下四种方式:-pdfminer:擅长文字的解析,把表格解析成普通的文本,没有格式;-pdf2html:把pdf解析成html,但html的标签并没有规律,解析一个表格还可以,多个表格的话不太好提取;-tabula:对于简...
继续阅读 >
前言亲人工作考试,公司给的题库好像是直接从数据库导出的表格Excel形式,在移动端上非常难看,需要不断左右上下滑动,看不了多少题眼就瞎了,遂主动请缨编写python脚本解决之。原本给的题库在手机上横屏显示是这样的↓↓↓(想象一下是在手机上)无比恶心我的工作公司给出的格式是.xlsx的(Excel表格的默认格式),盲猜是直接从答题数据库导出的,表名和属性名应该是稍微做了从英文到中文的改变,然后,就直接这样发给员工了…表...