0

約 4 TB のファイルを Mac サーバーから Windows Server08R2 に移動していました。互換性のない文字のため、多くのファイル名は使用できません。問題を修正するために名前変更ツールを実行し、再度コピーしました。私の問題は、「O'Neil」や「O_Neil」などの非常によく似た名前のフォルダーがたくさんあることです。実際、私が知る限り、それらはすべてこのルールに準拠しています。手作業で行うことが多すぎます。スクリプトを作成することを考えていますが、スクリプト作成の経験は限られています。変更日またはファイルサイズを比較し、フォルダーをアーカイブにマージまたは移動して、1 つのセットをそのまま残したいと思います。この状況でのベストプラクティスについてはわかりません。

1)理論的には、日付ごとにマージし、小さいバージョンをアーカイブするベストプラクティスは何ですか? 2)実際には、これを修正するにはどうすればよいですか?ツールはありますか?脚本のアイデア?

どんな助けでも大歓迎です。

4

1 に答える 1

0
find /path -type f -print0 | xargs -0 md5sum |
awk '
{
  if ($1 in seen)
    printf "duplicate: %s and %s\n", $2, seen[$1]
  else
    seen[$1] = $2
}
'

単一のディレクトリからコンテンツが重複するファイルを削除する [Perl、またはアルゴリズム]

于 2012-12-08T21:51:30.647 に答える