特定の条件に応じて、データ フレームから大量のデータを選択する必要があります。データ フレームは、おおよそ次のようになります。
F1 F2 D1 D2
1 A1 B1 1 0
2 A1 B1 1 1
3 A1 B1 0 0
4 A1 B2 1 0
5 A1 B2 0 0
6 A2 B2 1 0
7 A2 B2 1 1
はFx
因子で、Dx
はデータ値です。私がしなければならないことは次のとおりです。
- 特定のパターンに一致するデータ値を持つ行を検索します。
- そのパターンに一致する各行について、同じ因子を持つすべての行を見つけます
- 一意の因子の組み合わせごとに、その組み合わせを持つすべての行に何らかの操作を適用します
例えば、
factors <- unique(data[D1==1 & D2 == 1, c("F1","F2")])
ステップ1と2のほとんどを教えてくれます。
そして
data[data$F1 %in% factors$F1 & data$F2 %in% factors%F2,]
解決策に近づいていますが、上記の例のデータでは、これによりすべての行が選択されます。ただし、行 4 と 5 は完全に一致しないため、選択しないでください。%in% 一致が同じ行で発生することを必要とする何らかの条件を追加するにはどうすればよいですか?
これは一般的な操作であるべきだと思うので、Rにはおそらくこれを行うための賢い方法があります。
何か案は????ありがとう。