xml.etree.ElementTree可以通过支持的有限的XPath表达式来定位元素。语法ElementTree支持的语法如下:语法说明tag查找所有具有指定名称tag的子元素。例如:country表示所有名为country的元素,country/rank表示所有名为country的元素下名为rank的元素。*查找所有元素。如:*/rank表示所有名为rank的孙子元素。.选择当前元素。在xpath表达式开头使...
继续阅读 >
分类:python3
2020
09-24
09-24
Python3 操作 MySQL 插入一条数据并返回主键 id的实例
Python中貌似并没有直接返回插入数据id的操作(反正我是没找到),但是我们可以变通一下,找到最新插入的数据#!/usr/bin/envpython3#-*-coding:UTF-8-*-importpymysqldb=pymysql.connect(**db_conf)cursor=db.cursor()cursor.execute(sql)#最后插入行的主键idprint(cursor.lastrowid)#最新插入行的主键idprint(conn.insert_id())conn.commit()使用cursor.lastrowid和conn.insert_id()时一定要在conn.commit...
继续阅读 >
2020
09-24
09-24
python3实现往mysql中插入datetime类型的数据
昨天在这个上面找了好久的错,嘤嘤嘤~很多时候我们在爬取数据存储的时候都需要将当前时间作为一个依据,在python里面没有时间类型可以直接拿来就用的。我们只需要在存储之前将时间类型稍作修饰就行。datetime.datetime.now().strftime("%Y-%m-%d%H:%M:%S")如:#插入产品信息insert_good_sql="""INSERTINTOT_GOOD(good_name,good_type,img_src,good_description,how_to_use,volumetric,price,sale,spider_time)VALUE...
继续阅读 >
2020
09-24
09-24
python3将变量写入SQL语句的实现方式
试了一下python操作数据库,准备将前端传回来的用户名和密码写入表中试了半天不会把变量加在在sql语句里面网上搜索了一下,要用元组来传递多个参数sql="insertintouserinfovalues(%s,%s)"cursor.execute(sql,(name,password))补充拓展:python往mysql数据库中写入数据和更新插入数据1.连接mysqlimportpymysqldb=pymysql.connect(host='localhost',user='root',password='123456',port=3306,db='spiders')cursor=db....
继续阅读 >
2020
09-24
09-24
使用python3 实现插入数据到mysql
我就废话不多说了,直接上代码吧!pipinstallpymysqlimportpymysqlimportpandasaspdconn=pymysql.connect(host='localhost',user='root',password='root1234',db='test1',port=3306)cur=conn.cursor()#获取操作游标,也就是开始操作sql="""insertintoscore(sno,cno,degree)values('999','0-000','99')"""cur.execute(sql)conn.commit()conn.close()print('finished')补充拓展:python...
继续阅读 >
2020
09-24
09-24
解决python3插入mysql时内容带有引号的问题
插入mysql时,如果内容中有引号等特殊符号,会报错,解决方法可以用反斜杠转义,还可以用pymysql的一个方法自动转义:c='''北京时间9月20日晚间9点半,智能供应链服务供应商百世集团将在<aclass="wt_article_link"onmouseover="WeiboCard.show(2125973432,'tech',this)"href="?zw=tech"rel="externalnofollow"target="_blank">纽约证券交易所</a>正式挂牌上市,交易代码为“BSTI”。这是继<spanid="usstock_ZTO"...
继续阅读 >
2020
09-23
09-23
在python3中实现查找数组中最接近与某值的元素操作
我就废话不多说了,直接上代码吧!importdatetimedeffind_close(arr,e):start_time=datetime.datetime.now()size=len(arr)idx=0val=abs(e-arr[idx])foriinrange(1,size):val1=abs(e-arr[i])ifval1<val:idx=ival=val1use_time=datetime.datetime.now()-start_timereturnarr[idx],use_time.seconds*1000+use_time.microseconds/1000deffind_close_fast(arr,e):st...
继续阅读 >
2020
09-23
09-23
Python3使用xlrd、xlwt处理Excel方法数据
说在前头最近在做毕设,题目是道路拥堵预测系统,学长建议我使用SVM算法进行预测,但是在此之前需要把Excel中的数据进行二次处理,原始数据不满足我的需要,可是。。有346469条数据,不能每一条都自己进行运算并且将它进行归一化运算!!作为一个Java开发者,Python的使用我是从来没用过的啊,也是作死选了个这么难的题目。。后来在网上查阅发现xlrd可以通过Python代码读取Excel的文件,他的含义是xls文件的read(只读),另外它的...
继续阅读 >
2020
09-23
09-23
在python3中使用shuffle函数要注意的地方
1shuffle函数与其他函数不一样的地方shuffle函数没有返回值!shuffle函数没有返回值!shuffle函数没有返回值!仅仅是实现了对list元素进行随机排序的一种功能请看下面的坑1.1误认为shuffle函数会有一个返回值的错误例子num1=list(range(1,39526))#产生1-39525的数num2=random.shuffle(num1)num3=num2[0:30000]#取前30000个行号的元素num4=num2[30000:39524]#取到后面9525个元素执行结果:File"E:/pythonProj/test2/...
继续阅读 >
1.安装PillowpipinstallPillow2.安装tesseract-ocrgithub地址: https://github.com/tesseract-ocr/tesseract或本地下载地址:https://www.jb51.net/softs/538925.htmlwindows:Thelatestinstallercanbedownloadedhere: tesseract-ocr-setup-3.05.01.exe and tesseract-ocr-setup-4.00.00dev.exe (experimental). ubuntu:sudoapt-getinstalltesseract-ocrtraineddata文件路径:/usr/share/...
继续阅读 >
OCR,即OpticalCharacterRecognition,光学字符识别,是指通过扫描字符,然后通过其形状将其翻译成电子文本的过程,对应图形验证码来说,它们都是一些不规则的字符,这些字符是由字符稍加扭曲变换得到的内容,我们可以使用OCR技术来讲其转化为电子文本,然后将结果提取交给服务器,便可以达到自动识别验证码的过程tesserocr与pytesseract是Python的一个OCR识别库,但其实是对tesseract做的一层PythonAPI封装,pytesseract是Goog...
继续阅读 >
2020
09-23
09-23
Python3如何在Windows和Linux上打包
1、唠唠叨叨最近项目中需要Python的打包,看到网上也没有很详细的资料,于是做了一些示例程序。小小的研究了一下,Python如何在Windows和Linux上打包,并把程序源码以及各个记录上传到Github上与大家分享。2、背景Python版本:3.6.8Windows版本:Windows10家庭中文版64-bit(10.0,Build18362)(18362.19h1_release.190318-1202)Linux版本:centos7.43、Python打包工具今天没时间研究cx_Freeze,先研究了一下PyInstaller。3.1...
继续阅读 >