分类:R语言
2021
05-20
2021
05-20
数据分组,根据数据分析对象的特征,按照一定的数值指标,把数据分析对象划分为不同的区间部分来研究,以揭示内在的联系和规律性;在R中,我们常用ifelse函数来进行数据的分组,跟excel中的if函数是同一种用法。ifelse(condition,TRUE,FALSE)>data<-read.table('1.csv',sep='|',header=TRUE);>>level<-ifelse(+data$cost<=20,"(0,20]",+ifelse(+data$cost<=40,"(20,40]",+ifelse(+data$cost<=60...
继续阅读 >
可以先自定义函数也可以用的时候再定义。>mat<-matrix(c(1:3,7:9,4:6),byrow=T,nc=3)>mat[,1][,2][,3][1,]123[2,]789[3,]456>apply(mat,2,function(x){order(x,decreasing=T)[1]})#查找每一列[1]222>apply(mat,1,function(x){order(x,decreasing=T)[1]})#查找每一行[1]333>apply(mat,1,function(x){which.max(x)})#查找每一行...
继续阅读 >
2021
05-19
看代码吧~par(mar=c(5,5,3,4)+0.1)#似乎是设置图片位置bar<-barplot(gu[1:22,6],xlim=c(0.5,26),ylim=c(0,200000),ylab="交易量",col="blue",col.axis="blue",col.lab="blue")mtext(c(1:22),side=1,line=1,at=bar,cex=0.8,col="black")mtext("time",side=1,line=3,col="black")par(new=T)plot(bar,gu[1:22,2],axes=F,xlim=c(0.5,26),ylim=c(17,23),xlab="",ylab="",col="green",type="o")#ylim设置不好的话就会看不见折线ax...
继续阅读 >
R语言中,for循环运行比较慢for(iin1:1000){print(i^2)}补充:R语言:for循环使用小结基本结构展示:vals=c(5,6,7)for(vinvals){print(v)}#即把大括号里的内容对vals里的每一个值都循环run一遍实例展示:1.paste()命令是把几个字符连接起来如paste("A","B","C",sep="")得到的就是“ABC”,在次基础上写如下forloop:partnumber=c(1,2,5,78)for(iinpartnumber){print(paste("participantnumber",i,sep=""))}...
继续阅读 >
2021
05-15
在导入大批量数据时,如果没有显式地指定“stringsAsFactors=FALSE”,默认会将所有的字符串转换为因子,导致数据处理速度较慢。示例数据如下:name,math,english,sex,year"yiifaa",65,68,"M",2018"yiifee",95,98,"F",2018"guagua",75,78,"M",2018"MM",85,88,"F",2018查看数据概要,发现默认将字符串转换为因子,并进行了分组计数(这也是处理速度较慢的原因之一)概要如下:namemathenglishsexye...
继续阅读 >