2021
05-09
05-09
R语言 UTF-8各种问题的解决方案
R语言在碰到读UTF-8文件,或者处理UTF-8数据时总是会遇到各种各样的问题,本姑娘也是在碰了n多次壁,被气得吐血好多次之后,终于对这类总结出了一些解决办法:1.读UTF-8文件,例如UTF-8格式的csv:最好的处理办法就是:a1=read.table('C:\\test11.csv',sep=',',fileEncoding='UTF-8',header=F)如果使用如下方法可能会出错(全是血泪教训啊):a2=read.csv('C:\\test11.csv',fileEncoding='UTF-8',header=F)a2=read.csv('C...
继续阅读 >
在分析数据时我们经常会遇到将变量值转换成其他的值的情况(如:将连续变量转成分类变量)这时就需要我们对原有数据进行重新编码。本文将介绍R软件中常用的三种重编吗方法:1、使用逻辑判断式编码。2、使用cut函数编码。3、使用car程序包的recode函数。(一)使用逻辑判断式(1)现假设我们需要将下面的连续型变量x按照10与20分成三个组,新的分组名称为1、2、3:>x2=1*(x<=10)+2*(x>10&x<=20)+3*(x>20)>x2[1]12323333...
R语言按日期分组求相关系数前几天得到了3700+支股票一周内的波动率,想要计算每周各个股票之间的相关系数并将其可视化。最终结果保存在制定文件夹中。部分数据如下:先读取数据data<-read.csv("D:/data/stock_day_close_price_week_series.csv",header=TRUE,blank.lines.skip=TRUE)利用mice包处理缺失值:library(lattice)library(MASS)library(mice)aggr(data,prop=FALSE,numbers=TRUE,sortVars=TRUE)#查看缺...
今天博客主要是解决一个学R语言里面最最痛苦的问题(嗯,python2.x里面也有),就是中文乱码问题:一般用R语言的同学,多半遇见过以下这个问题:反正虾神我每次遇见这个问题,立刻就是:实际上这个问题写代码的人一般都能遇见,不同字符编码的问题,如果是从文件里面读的还好说,可以带这个字符编码集一起读,但是如果这个数据是来自于数据库的,如果经验的话,那就真得各种凉拌了。下面我简单把我今天通过R语言从Postgresql数据库...
散点图显示在笛卡尔平面中绘制的许多点。每个点表示两个变量的值。在水平轴上选择一个变量,在垂直轴上选择另一个变量。使用plot()函数创建简单散点图。语法在R语言中创建散点图的基本语法是-plot(x,y,main,xlab,ylab,xlim,ylim,axes)以下是所使用的参数的描述- x是其值为水平坐标的数据集。y是其值是垂直坐标的数据集。main要是图形的图块。xlab是水平轴上的标签。ylab是垂直轴上的标签。...
折线图是通过在它们之间绘制线段来连接一系列点的图。这些点在它们的坐标(通常是x坐标)值之一中排序。折线图通常用于识别数据中的趋势。R语言中的plot()函数用于创建折线图。语法在R语言中创建折线图的基本语法是-plot(v,type,col,xlab,ylab)以下是所使用的参数的描述- v是包含数值的向量。类型采用值“p”仅绘制点,“l”仅绘制线和“o”绘制点和线。xlab是x轴的标签。ylab是y轴的标签。main是图...
直方图表示被存储到范围中的变量的值的频率。直方图类似于条形图,但不同之处在于将值分组为连续范围。直方图中的每个柱表示该范围中存在的值的数量的高度。R语言使用hist()函数创建直方图。此函数使用向量作为输入,并使用一些更多的参数来绘制直方图。语法使用R语言创建直方图的基本语法是hist(v,main,xlab,xlim,ylim,breaks,col,border)以下是所使用的参数的描述v是包含直方图中使用的数值的向量。main表示图表的标...
条形图表示矩形条中的数据,条的长度与变量的值成比例。R语言使用函数 barplot() 创建条形图。R语言可以在条形图中绘制垂直和水平条。在条形图中,每个条可以给予不同的颜色。语法在R语言中创建条形图的基本语法是H是包含在条形图中使用的数值的向量或矩阵。xlab是x轴的标签。ylab是y轴的标签。main是条形图的标题。names.arg是在每个条下出现的名称的向量。col用于向图中的条...