それぞれ985257行と984997行で構成される元のドライブと複製ドライブからのファイルリストがあります。
行数が一致しないため、一部のファイルが重複していないと確信しています。
どのファイルが存在しないかを確認するために、sedを使用して、ソースリストから重複リストに存在する行を削除することにより、元のファイルリストをフィルタリングしたいと思います。
Excelで一致式を使用することを考えていましたが、行数が原因でプログラムがクラッシュします。sedでこのアプローチを使用することは実行可能なオプションだと思いました。
しかし、これまでのところ、私のアプローチでは成功していません。
echo "Start"
# Cat the passed argument which is the duplicate file listing
for line in $(cat $1)
do
#sed the $line variable over the larger file and remove
#sed "${line}/d" LiveList.csv
#sed -i "${line}/d" LiveList.csv
#sed -i '${line}' 'd' LiveList.csv
sed -i "s/'${line}'//" /home/listings/LiveList.csv
done
作成されてリストファイルの103.4MBに満たされる一時ファイルがありますが、リストファイル自体はまったく変更されていません。
私の他の懸念は、リストがウィンドウで作成されているため、「\」文字が文字列をエスケープして一致せず、したがって変更されない可能性があることです。
Example path:
Path,Length,Extension
Jimmy\tail\images\Jimmy\0001\0014\Text\A0\20\A056TH01-01.html,71982,.html
助けてください。