私のデータセットは、個人ごとに 3 つの処理 (C、S、および E) で構成されています。このように見えます。
    Year   Cultivar   Site   Distance   Plant   Treat    yield1   yield2
1   2011   Blue       ABR    0m         1       C        0.879    1.5
2   2011   Blue       ABR    0m         1       S        0.384    2.3
3   2011   Blue       ABR    0m         1       E        0.03     0.5
4   2011   Blue       ABR    0m         2       C        0.923    1.2
5   2011   Blue       ABR    0m         2       S        0.344    0.5
6   2011   Blue       ABR    0m         2       E        0.07     0.7
7   2011   Blue       ABR    50m        1       C        0.255    3.4
8   2011   Blue       ABR    50m        1       S        1.00     2.4
9   2011   Blue       ABR    50m        1       E        0.1      0.9
.
.
.
2 年分のデータ、2 つの栽培品種、15 のサイト、サイトあたり 3 つの距離、および距離あたり 10 の植物があります。基本的に、大量のデータ (>1400 行) があります。私ができるようにしたいのは、研究全体で各個人に新しい番号を割り当てる新しい列を追加することです. 私は自分のデータをこのように仕上げたいと思っています。
    Individual  Year   Cultivar   Site   Distance   Plant   Treat    yield1   yield2
1   1           2011   Blue       ABR    0m         1       C        0.879    1.5
2   1           2011   Blue       ABR    0m         1       S        0.384    2.3
3   1           2011   Blue       ABR    0m         1       E        0.03     0.5
4   2           2011   Blue       ABR    0m         2       C        0.923    1.2
5   2           2011   Blue       ABR    0m         2       S        0.344    0.5
6   2           2011   Blue       ABR    0m         2       E        0.07     0.7
7   3           2011   Blue       ABR    50m        1       C        0.255    3.4
8   3           2011   Blue       ABR    50m        1       S        1.00     2.4
9   3           2011   Blue       ABR    50m        1       E        0.1      0.9
.
.
.
私はRに比較的慣れていないので、これが比較的簡単にできるはずであれば申し訳ありません。植物*距離*場所*栽培品種*年の一意の組み合わせとして各個体を「見つける」ことができるはずですが、正直なところ、これをどのようにコーディングするのかわかりません。見つけることができませんでした同様のヘルプ ページ。
どんな提案でも大歓迎です!