R语言中数据集合并
在数据整理过程,有时候需要对多个数据文件进行合并。总的来说,数据集合并包括两个方面。1、数据集横向合并,即两个数据集的变量不同。例如两个.xlsx数据集,其中一个数据集中包括ID、age、gender,另外一个数据集中包括ID、height、weight、BMI。此时可以使用merge()函数进行两个数据集的合并。R代码如下:library(readxl)setwd("d:/data")data1
在数据整理过程,有时候需要对多个数据文件进行合并。总的来说,数据集合并包括两个方面。
1、数据集横向合并,即两个数据集的变量不同。
例如两个.xlsx数据集,其中一个数据集中包括ID、age、gender,另外一个数据集中包括ID、height、weight、BMI。此时可以使用merge()函数进行两个数据集的合并。R代码如下:
library(readxl)
setwd("d:/data")
data1<-read_xlsx("data1.xlsx")
data2<-read_xlsx("data2.xlsx")
data_totol<-merge(data1,data2,by="ID",all=T)
需要注意的是,当两个文件中的ID不完全一致时,这个时候可以根据实际需要选择是保留全部ID(all=T),还是某个数据集中的ID(all.x=T or all.y=T)。
2、数据集纵向合并,即两个数据集变量名称一致。合并后列数不变,行数增加。
例如两个.xlsx数据集,其中一个数据集中包括ID、age、gender,另外一个数据集中也包括ID、age、gender。此时可以使用rbind()函数进行两个数据集的合并。R代码如下:
library(readxl)
setwd("d:/data")
data1<-read_xlsx("data1.xlsx")
data2<-read_xlsx("data2.xlsx")
data_totol<-rbind(data1,data2)
注意:两个数据集的变量名称必须一致。否则报错。
更多推荐
所有评论(0)