1 つの列に基づいて 2 つのファイルを照合し、一致する行を結合したいと考えています。しかし、ファイルの 1 つ ( file1.txt
) に同じエントリが複数回含まれています。例として:
file1.txt
chr:123 a
chr:123 b
chr:456 a
file2.txt
chr:123 aa
chr:456 bb
最初の列に基づいてインデックスを抽出したいと思います。
最終的な出力は次のようになります。
chr:123 a aa
chr:123 b aa
chr:456 a bb
R で intersect を試みましたfile1.txt
が、同じエントリが複数回ある場合に一致する行を結合する方法がわかりませんでした。2 つの for ループを使用していますが、ファイルが非常に大きく、時間がかかります。
perl または R でこれを行うより迅速な方法はありますか?