-1

次のように、列形式で配置された 2 つの異なるデータセットがあります。

データセット 1:

A   B   C   D   E

13  1   1.7 2   1
13  2   5.3 2   1
13  2   2   2   1
13  2   1.8 2   1
1   6   27  9   1
1   6   6.6 9   1
1   7   17  9   1
1   7   7.1 9   1
1   7   8.5 9   1

データセット 2:

A   B   F   G
13  1   42  1002
13  2   42  1002
13  2   42  1002
13  2   42  1002
13  3   42  1002
13  4   42  1002
13  5   42  1002
1   2   27  650
1   3   27  650
1   4   27  650
1   6   27  650
1   7   27  650
1   7   27  650
1   7   27  650
1   8   27  650

両方のデータセットの行番号は可変ですが、2 つのサンプルのデータが含まれています (たとえば、列 A: 13 と両方のデータセットの 1)。データセット 1 の CD 値と E 値をデータセット 2 に配置し、両方のデータセットで A と B の値が同じになるようにします。したがって、結合は A と B に基づいている必要があります。約 47560 行に対してこれを行う必要があります。

私は R が初めてなので、新しいマージされたデータセットを R に保存するためのコードを取得できればありがたいです。

4

1 に答える 1

4

R のマージ関数を使用します。

からの参照: http://www.statmethods.net/management/merging.html

編集:最初にデータセットを読み込む必要があります。CSV は適切な形式です。

> dataset1 <- read.csv(file="dataset1.csv", head=TRUE, sep=",") 
> dataset2 <- read.csv(file="dataset2.csv", head=TRUE, sep=",")

ここで変数名を入力して Enter キーを押すと、データセットが読み出されるはずです。そう...

> dataset1

上記のデータを読み取る必要があります。次に、次のことが起こるはずだと思います...私は間違っているかもしれません...

> dataset1_2 <- merge(dataset1, dataset2, by=c("A","B"))

編集2:

> write.table(dataset1_2, "c:/dataset1_2.txt", sep=" ")

参考:http ://www.statmethods.net/input/exportingdata.html

于 2013-06-23T05:44:05.930 に答える