2 つの巨大なテキスト ファイル (サイズが 1 ~ 5 GB) があり、シェル コマンドを使用してそれらの違いを計算する必要があります。問題は、これらのファイルの各行で、特定の位置にあるいくつかの文字を無視しなければならないことです。
最初は diff を使用し、2 つのファイルから無視する必要があるものを切り取りました。
diff <(cut -b1-58,69- FILE1.TXT) <(cut -b1-58,69- FILE2.TXT) > OUTPUT.TXT;
しかし問題は、出力ファイルにカット文字が含まれていないことです。
例
ファイル1:
0123456311020130123456
aaaaaaA31102013aaaaaaA
bbbbbbb31102013bbbbbbbb
ファイル 2:
0123456310920130123456
1111111310920131111111
aaaaaaB31092013aaaaaaB
bbbbbbb31092013bbbbbbbb
diff は各行の 8 から 15 までの文字を無視し、新しい行も出力に返す必要があります。
出力:
1111111310920131111111
aaaaaaB31092013aaaaaaB
誰でも私を助けることができますか?
どうもありがとう、フランチェスコ