Mac OSXでfdupesを使用して、ディレクトリから重複するテキストファイルを削除しようとしています。すでに多数の重複が削除されています。
私が今抱えている問題は、残っているファイルの多くが重複していることです。ただし、ファイルの1つでは、ファイル名が最初の行で、その後に空の行が続き、その後にテキストが続きます。
そこで、ファイル名が上部に繰り返されているすべてのファイルを見つけて、これと次の空白行を削除して、fdupesがそれらを重複として認識できるようにします。これにより、fdupesを使用してそれらを解析できるようになります。
例:
file001.txt:
test 123
test
file002.001.txt:
file002.001.txt
test 123
test
これについて行くための最良の方法は何ですか?