2021
10-17
10-17
Python中collections.Counter()的具体使用
目录Counter类创建计数值的访问与缺失的键计数器的更新键的删除elements()most_common([n])fromkeys浅拷贝copy算术和集合操作常用操作Counter类Counter类的目的是用来跟踪值出现的次数。它是一个无序的容器类型,以字典的键值对形式存储,其中元素作为key,其计数作为value。计数值可以是任意的Interger(包括0和负数)。Counter类和其他语言的bags或multisets很相似。创建Counter是一个容器对象,主要的作用是用来统计散列对象,可...
继续阅读 >
splinter介绍 Splinter是一个使用Python测试Web应用程序的开源工具,可以自动化浏览器操作,例如访问URL和与它们的项进行交互。例如,我们使用百度引擎搜索内容,需要再搜索框内输入关键字,再按百度一下即可以搜索想要的内容,使用Splinter可以使用pyhton脚本来实现上述过程。Splinter安装 Splinter的使用需要依赖python环境,因此首先需要装python(python安装可以直接安装anaconda集成环境,网上一搜...
目录1.pandas查看数据占用大小2.对数据进行压缩3.参考资料💃今天看案例的时候看见了一个关于pandas数据的内存压缩功能,特地来记录一下。🎒先说明一下情况,pandas处理几百兆的dataframe是没有问题的,但是我们在处理几个G甚至更大的数据时,就会特别占用内存,对内存小的用户特别不好,所以对数据进行压缩是很有必要的。1.pandas查看数据占用大小给大家看一下这么查看自己的内存大小(user_log是dataframe的名...
目录安装Selenium写代码点位网页元素我们今天介绍一个非常适合新手的python自动化小项目,项目虽小,但是五脏俱全。它是一个自动化操作网页浏览器的小应用:打开浏览器,进入百度网页,搜索关键词,最后把搜索结果保存到一个文件里。这个例子非常适合新手学习Python网络自动化,不仅能够了解如何使用Selenium,而且还能知道一些超级好用的小工具。当然有人把操作网页,然后把网页的关键内容保存下来的应用一律称作网络爬虫,好吧...
目录百度地图开放平台介绍需要用到的API编写Python程序1.获取对应地点的经纬度2.获取两地之间的距离3.合并函数调用4.进行简单的功能测试5.对Excel中的批量地点计算距离百度地图开放平台进入百度地图开放平台后,登陆用户,点击上方的控制台,按照提示进行激活后创建服务端类型的应用,应用名任意设置,其中白名单校验不做任何限制可以填写0.0.0.0/0。创建成功后画面应如下图所示,其中访问应用(AK)即途中红色方框圈起来的部分一...
众所周知,OpenStack的通信方式有两种,一种是基于HTTP协议的RESTFulAPI方式,另一种则是RPC调用。两种通信方式的应用场景有所不同,在OpenStack中,前者主要用于各组件之间的通信(如nova与glance的通信),而后者则用于同一组件中各个不同模块之间的通信(如nova组件中nova-compute与nova-scheduler的通信)。nova中rpc调用非常多,用pycharm点点点跟函数的时候遇到rpc就会点不下去了,不解决直接就看不下去了那种多法什么是RP...
目录前言工作原理代码前言工作中偶尔会遇到文件去重的事情,收到一大堆文件,名称各不相同,分析文件的时候发现有不少重复的文件,导致工作效率低下,那么,这里就写了一个python脚本实现文件去重功能工作原理脚本会检查你给出的文件路径下的所有文件,然后计算每个文件的MD5值,并将其加入到一个列表中。如果某文件的MD5值不在列表中,就认定其是我们需要的文件,脚本会在桌面新建一个名为“去重结果”的文件夹,并将其复制到...
经常使用word办公的小伙伴们经常会遇到邮件合并的任务,通常会将数量有限的表格中的信息通过word的邮件合并功能,自动生成word文档,操作熟练的技术员通常不到十分钟就可以合并几十份邮件。那么如果遇到成千上万份的邮件需要合并并且需要各自生成文件呢?一个excel大佬也需要很长时间吧!既然我们很难在excel上追上大佬的脚步,何不另辟蹊径,找一条更适合自己的方法呢?我是一年多前接触到python自动化办公的,通过进一步的学习,...