私のデータセットは、個人ごとに 3 つの処理 (C、S、および E) で構成されています。このように見えます。
Year Cultivar Site Distance Plant Treat yield1 yield2
1 2011 Blue ABR 0m 1 C 0.879 1.5
2 2011 Blue ABR 0m 1 S 0.384 2.3
3 2011 Blue ABR 0m 1 E 0.03 0.5
4 2011 Blue ABR 0m 2 C 0.923 1.2
5 2011 Blue ABR 0m 2 S 0.344 0.5
6 2011 Blue ABR 0m 2 E 0.07 0.7
7 2011 Blue ABR 50m 1 C 0.255 3.4
8 2011 Blue ABR 50m 1 S 1.00 2.4
9 2011 Blue ABR 50m 1 E 0.1 0.9
.
.
.
2 年分のデータ、2 つの栽培品種、15 のサイト、サイトあたり 3 つの距離、および距離あたり 10 の植物があります。基本的に、大量のデータ (>1400 行) があります。私ができるようにしたいのは、研究全体で各個人に新しい番号を割り当てる新しい列を追加することです. 私は自分のデータをこのように仕上げたいと思っています。
Individual Year Cultivar Site Distance Plant Treat yield1 yield2
1 1 2011 Blue ABR 0m 1 C 0.879 1.5
2 1 2011 Blue ABR 0m 1 S 0.384 2.3
3 1 2011 Blue ABR 0m 1 E 0.03 0.5
4 2 2011 Blue ABR 0m 2 C 0.923 1.2
5 2 2011 Blue ABR 0m 2 S 0.344 0.5
6 2 2011 Blue ABR 0m 2 E 0.07 0.7
7 3 2011 Blue ABR 50m 1 C 0.255 3.4
8 3 2011 Blue ABR 50m 1 S 1.00 2.4
9 3 2011 Blue ABR 50m 1 E 0.1 0.9
.
.
.
私はRに比較的慣れていないので、これが比較的簡単にできるはずであれば申し訳ありません。植物*距離*場所*栽培品種*年の一意の組み合わせとして各個体を「見つける」ことができるはずですが、正直なところ、これをどのようにコーディングするのかわかりません。見つけることができませんでした同様のヘルプ ページ。
どんな提案でも大歓迎です!