2 つのファイルがあり、各ファイルにはファイル名の md5 チェックサムがあります。どちらも別のフォルダにあります。これらのファイルを貼り付けるとき、次のことを行うメカニズムを探しています。
$column 3 が $column 6 と一致する場合、これら 2 つだけを並べて出力します。
filename1 = md5_checksum filename2 = md5_checksum
filename3 = md5_checksum filename4 = md5_checksum
filename5 = md5_checksum filename6 = md5_checksum
希望の結果:
filename1 = md5_checksum filename6 = md5_checksum
したがって、次の出力を想像 (またはテスト) します。
md5 directoryA/* > checkA ; md5 directoryB/* > checkB
paste checkA checkB
私は言いたいです:「checkAを見てください。filename1は別の名前ですがcheckBにもあります」(同じチェックサム)
参考までに、私が試したこと:
awk > SIMILAR 'NR==FNR{ _[$4]=$4 next}{print $0, _[$4,$4] }' checkA checkB
($4 は両方のファイル checkA と checkB のフィールドです)
これが、私がやろうとしていることに関する最良の説明であると私が認識していることです。迅速に回答していただき、誠にありがとうございます。
# touch A/{fee,fie,foo,fum}
# touch B/{Bee,Bie,Boo,Bum}
# md5 B/* > checkB
# md5 A/* > checkA
# more checkA
MD5 (A/fee) = 2737b49252e2a4c0fe4c342e92b13285
MD5 (A/fie) = df8b712c4fe20a0df933819665770165
MD5 (A/foo) = 51ca4befb7cb5bd22766a33c73ffca5b
MD5 (A/fum) = a80b2c31cfc269e4aa2f48658b5349d9
# more checkB
# md5 B/*
MD5 (B/Bee) = b026324c6904b2a9cb4b88d6d61c81d1
MD5 (B/Bie) = 2737b49252e2a4c0fe4c342e92b13285
MD5 (B/Boo) = df8b712c4fe20a0df933819665770165
MD5 (B/Bum) = 51ca4befb7cb5bd22766a33c73ffca5b
ここで見ると、A のファイル foo (A/foo) は B/Bum に似ています。
出力を次のようにしたいと思います。
A/foo B/Bum = 51ca4befb7cb5bd22766a33c73ffca5b
A/fee B/Bie = 2737b49252e2a4c0fe4c342e92b13285