2021
05-09
05-09
R语言-进行数据的重新编码(recode)操作
在分析数据时我们经常会遇到将变量值转换成其他的值的情况(如:将连续变量转成分类变量)这时就需要我们对原有数据进行重新编码。本文将介绍R软件中常用的三种重编吗方法:1、使用逻辑判断式编码。2、使用cut函数编码。3、使用car程序包的recode函数。(一)使用逻辑判断式(1)现假设我们需要将下面的连续型变量x按照10与20分成三个组,新的分组名称为1、2、3:>x2=1*(x<=10)+2*(x>10&x<=20)+3*(x>20)>x2[1]12323333...
继续阅读 >
lxml是python的一个解析库,支持HTML和XML的解析,支持XPath解析方式,而且解析效率非常高XPath,全称XMLPathLanguage,即XML路径语言,它是一门在XML文档中查找信息的语言,它最初是用来搜寻XML文档的,但是它同样适用于HTML文档的搜索XPath的选择功能十分强大,它提供了非常简明的路径选择表达式,另外,它还提供了超过100个内建函数,用于字符串、数值、时间的匹配以及节点、序列的处理等,几乎所有我们想要定位的节点,都可...