在数据整理过程,有时候需要对多个数据文件进行合并。总的来说,数据集合并包括两个方面。

1、数据集横向合并,即两个数据集的变量不同。

例如两个.xlsx数据集,其中一个数据集中包括ID、age、gender,另外一个数据集中包括ID、height、weight、BMI。此时可以使用merge()函数进行两个数据集的合并。R代码如下:

library(readxl)

setwd("d:/data")

data1<-read_xlsx("data1.xlsx")

data2<-read_xlsx("data2.xlsx")

data_totol<-merge(data1,data2,by="ID",all=T)

需要注意的是,当两个文件中的ID不完全一致时,这个时候可以根据实际需要选择是保留全部ID(all=T),还是某个数据集中的ID(all.x=T or all.y=T)。

2、数据集纵向合并,即两个数据集变量名称一致。合并后列数不变,行数增加。

例如两个.xlsx数据集,其中一个数据集中包括ID、age、gender,另外一个数据集中也包括ID、age、gender。此时可以使用rbind()函数进行两个数据集的合并。R代码如下:

library(readxl)

setwd("d:/data")

data1<-read_xlsx("data1.xlsx")

data2<-read_xlsx("data2.xlsx")

data_totol<-rbind(data1,data2)

注意:两个数据集的变量名称必须一致。否则报错。

Logo

科技之力与好奇之心,共建有温度的智能世界

更多推荐