次のようなデータセットがあります。
ColA ColB ColC ColD ColE
rs778 C Can + C/T
rs778 C Pro + C/T
rs779 P Can + A/G
rs779 P Can - A/G
列Cに基づいて列Aの重複エントリを削除したい。言い換えると、列Aの2つのエントリが同じである場合、残りの行は列Cのエントリによって決定されるようにします。列Cのエントリの場合が同じである場合、残る行は列Dで決定する必要があります。「Can」>「Pro」および「+」>「-」の場合、探している最終出力は次のようになります。
ColA ColB ColC ColD ColE
rs778 C Can + C/T
rs779 P Can + A/G
以下を使用して、完全に重複したデータを削除しました。
data2 <- data[!duplicated(data[-2]),]
そして、私の解決策が、私がまだ発見していないこれのいくつかの修正にあることを望んでいます。ご協力いただきありがとうございます!