私はsolarisシステムでnawkスクリプトを実行して、file2にないfile1のレコードを取得し、次のスクリプトを使用してしばらくして重複レコードを見つけています-
比較:
nawk 'NR==FNR{a[$0]++;next;} !a[$0] {print"line":" FNR $0}' file1 file2
複製:
nawk '{a[$0]++}END{for(i in a){if(a[i]-1)print i,a[i]}}' file1
スクリプトの途中でエラーメッセージが表示されます
nawk: レコード 971360 の tostring にスペースがありません
200 万レコードのファイルを使用しています。