前言在算face_track_idmap有感:开始验证data={'state':[1,1,2,2,1,2,2,2],'pop':['a','b','c','d','b','c','d','d']}frame=pd.DataFrame(data)frameframe.shape$(8,2)#说明duplicated()是对整行进行查重,return重复了的数据,且只现实n-1条重复的数据(n是重复的次数)frame[frame.duplicated()==True]一开始还很疑惑,明明(1,b)只出现了1次,哪里duplicate了。其实,人家return的结果是去掉已经出现过一次的行数据了...
继续阅读 >
分类:PYTHON
2021
07-09
07-09
详解Python OpenCV数字识别案例
目录前言一、案例介绍二、步骤1、模板读入,以及一些包的导入,函数定义等2、模板预处理,将模板数字分开,并排序3、输入图像预处理,将图像中的数字部分提取出来4、模板匹配总结前言实践是检验真理的唯一标准。因为觉得一板一眼地学习OpenCV太过枯燥,于是在网上找了一个以项目为导向的教程学习。话不多说,动手做起来。一、案例介绍提供信用卡上的数字模板:要求:识别出信用卡上的数字,并将其直接打印在原图片上。虽然看起来很...
继续阅读 >
2021
07-09
07-09
详解如何创建Python元类
目录什么是Python元类?Python中的类和对象Python中的动态类Python元类如何工作?类型类Python中的自定义元类Python中的__call__是什么?装饰器vs元类什么是Python元类?Python元类是与Python的面向对象编程概念相关的高级功能之一。它确定类的行为,并进一步帮助其修改。用Python创建的每个类都有一个基础的Metaclass。因此,在创建类时,您将间接使用元类。它隐式发生,您无需指定任何内容。与元编程相关联的元类决定了程序对其...
继续阅读 >
2021
07-09
07-09
python eval 转换k m到乘法计算的操作
原数据lambda函数处理我之前写了各种ifsubstr函数,各种报错正确到热泪盈眶的函数data['Followers/Fans']=data['Followers/Fans'].str.replace('k|K','*1000').str.replace('m|M','*1000000').fillna('0')data['Followers/Fans']=data['Followers/Fans'].apply(eval)报错函数#deftrans(x):#x=str(x)#x=x.strip()#去除首尾空格#if(x[-1]=='k'orx[-1]=='K'):#returnfloat(x[0:-1])*...
继续阅读 >
2021
07-08
07-08
python 如何设置柱状图参数
version:python3.6环境:anaconda/JupyterLab0.27.0操作系统:Windows10importpandasaspdimportmatplotlib.pyplotasplta=pd.DataFrame(train_set['收率'].value_counts()).reset_index()a.rename(columns={'index':'yield','收率':'frequency'},inplace=True)a.head()plt.figure(figsize=(24,8))plt.bar(a['yield'].values,a['frequency'].values.round(2),color='rgb',width=0.005,tick_label=a['yield'].values....
继续阅读 >
2021
07-08
07-08
浏览器常用基本操作之python3+selenium4自动化测试(基础篇3)
1、打开指定的网页地址我们使用selenium进行自动化测试时,打开浏览器之后,第一步就是让浏览器访问我们指定的地址,可使用get方法实现fromseleniumimportwebdriverdriver=webdriver.Edge()driver.get('https://www.baidu.com/')#本行用于访问指定的地址2、获取当前页面url我们在测试过程中,有时需要获取当前页面的url以判断是否跳转到指定页面,获取页面url的方法如下:fromseleniumimportwebdriverdriver=webdriv...
继续阅读 >
2021
07-08
07-08
python 实现图与图之间的间距调整subplots_adjust
如下所示:plt.subplots_adjust(left=None,bottom=None,right=None,top=None,wspace=0.15,hspace=0.15)图与图之间的间距调整wspace=0.15,hspace=0.15补充:python如何调整subplot的间距https://matplotlib.org/api/_as_gen/matplotlib.pyplot.subplots_adjust.htmlplt.subplots_adjust(left=None,bottom=None,right=None,top=None,wspace=None,hspace=None)left=0.125#theleftsideofthesubplotsof...
继续阅读 >
2021
07-08
07-08
详解python字符串驻留技术
目录前言1、什么是“字符串驻留”?2、为什么要驻留字符串?3、Python的字符串驻留4、字符串驻留的原理4.1如何驻留字符串?4.2如何清理驻留的字符串?5、字符串驻留的实现5.1变量、常量与函数名5.2字典的键5.3任何对象的属性5.4显式地驻留6、字符串驻留的其它发现前言每种编程语言为了表现出色,并且实现卓越的性能,都需要有大量编译器级与解释器级的优化。由于字符串是任何编程语言中不可或缺的一个部分,因此,如果有快速...
继续阅读 >
2021
07-08
07-08
python spilt()分隔字符串的实现示例
1spilt()方法作用 通过指定分隔符对字符串进行分隔注意要拆分的字符串需要要一定规律的分隔符,比如"Pythonisagoodlanguage"这个字符串中间都有个空格,那么我们可以通过这个空格来分隔这个字符串2 demo解释spilt()的使用2.1通过指定的字符分隔字符importrecontent="abcabcabc"rex=re.search("c",content)print(rex)打印结果如下2.2分隔指定的几个的字符importrecontent="abcabcabc"rex=re.sear...
继续阅读 >
2021
07-08
07-08
python生成器generator:深度学习读取batch图片的操作
在深度学习中训练模型的过程中读取图片数据,如果将图片数据全部读入内存是不现实的,所以有必要使用生成器来读取数据。通过列表生成式,我们可以直接创建一个列表。但是,受到内存限制,列表容量肯定是有限的。而且,创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的...
继续阅读 >
2021
07-08
07-08
python判断集合的超集方法及实例
1、说明可以使用>=运算符判断当前集合是否为另一个集合的超集,即判断集合b中的所有元素是否都包含在集合a中。2、语法set_a>=set_b#相当于set_a.issuperset(set_b)3、参数set_a:集合a。set_b:集合b。4、返回值返回布尔值,如果集合b中的所有元素都包含在集合a中,则返回True,否则返回False。5、实例#创建集合a={'赵','钱','孙','李'}b={'赵','孙','李','周','吴'}c={'赵','孙'}d={'王','...
继续阅读 >
2021
07-08
07-08
Python深度学习之Pytorch初步使用
目录一、Tensor二、Pytorch如何创建张量2.1创建张量2.2tensor与ndarray的关系2.3常用api2.4常用方法三、数据类型3.1获取数据类型四、tensor的其他操作4.1相加4.2tensor与数字的操作五、CUDA中的tensor一、TensorTensor(张量是一个统称,其中包括很多类型):0阶张量:标量、常数、0-DTensor;1阶张量:向量、1-DTensor;2阶张量:矩阵、2-DTensor;……二、Pytorch如何创建张量2.1创建张量importtorcht=torch.Tens...
继续阅读 >
2021
07-08
07-08
Python快速优雅的批量修改Word文档样式
目录需求描述步骤分析和前置知识代码实现写在最后需求描述手上现有若干份财务分析报告的Word文档,如下:每一份Word文档中的内容如下:为了方便后续审阅,需要将所有文档中所有含有资金的语句标红加粗,如图所示步骤分析和前置知识为了解决这个需求简单复习一下相关知识。Word文档一般而言由文档(document)-段落(paragraph)-文字块(run)三级结构组成:从需求反馈中可以看出,本质上我们需要做的就是对所有含有资金的文字块Run...
继续阅读 >
2021
07-08
07-08
python 提取html文本的方法
假设我们需要从各种网页中提取全文,并且要剥离所有HTML标记。通常,默认解决方案是使用BeautifulSoup软件包中的get_text方法,该方法内部使用lxml。这是一个经过充分测试的解决方案,但是在处理成千上万个HTML文档时可能会非常慢。通过用selectolax替换BeautifulSoup,您几乎可以免费获得5-30倍的加速!这是一个简单的基准测试,可分析commoncrawl(`处理NLP问题时,有时您需要获得大量的文本集。互联网是文本的最大来源,但是不幸...
继续阅读 >
2021
07-08
07-08
Python 京东云无线宝消息推送功能
配置文件注释里面有写,懒得用配置文件了代码#京东云无线路由宝推送importrequestsimportjsonimporttimeimporthmacimporthashlibimportbase64importurllib.parsefromdatetimeimportdatetime#发送钉钉消息defsendinfo_ding(token,secret,data):dic=get_timestamp_and_sign_by_secret(secret)timestamp=dic['timestamp']sign=dic['sign']url='https://oapi.dingtalk.com/robot/send?access_token...
继续阅读 >
2021
07-08
07-08
Python数据分析之pandas比较操作
目录一、比较运算符和比较方法二、两个DataFrame比较三、两个Series比较四、与数字或字符串比较五、与array进行比较一、比较运算符和比较方法比较运算符用于判断是否相等和比较大小,Python中的比较运算符有==、!=、<、>、<=、>=六个,Pandas中也一样。在Pandas中,DataFrame和Series还支持6个比较方法,详见下表。方法英文全称用途eq...
继续阅读 >