R に次のようなデータ フレームがあります。
bin Family Genus
1 blue flower
1 green moss
1 blue tree
2 red bird
2 red lizard
同じビンが複数回存在する可能性があり、関連付けられた科/属が 1 つのビンに固有ではない場合があります。各ビンに関連付けられているすべてのファミリと、各ファミリが各ビンに関連付けられている回数を特定しようとしています。属のテストを繰り返します。
私は最終的に、各ビンに関連付けられた名前にバリエーションがあるかどうかを特定しようとしています。これにより、各ビンに最も一般的な名前を選択し、そのビンに 1 つの名前だけを割り当てることができます。私のデータ フレームは非常に大きく、何千ものビンがあります。