column1 と column2 (スペースで区切られている) に次の内容のテキスト ファイルがたくさんあります。
アドレス0 データ0
アドレス1 データ1
.
.
.
アドレスN データN
すべてのデータ値は一意 (ランダム) ですが、一部のアドレス値は繰り返されます。AWK / sort / uniq を使用して、既に指定されているアドレスを持つ行を削除するにはどうすればよいですか?
基本的に、関連するデータが何であれ、テキスト ファイル内に重複するアドレスがあってはなりません。
awk '
$1 in seen {next}
{print; seen[$1] = 1}
' file ...
sort -k1 -u your_file > outputfile
ほとんどの UNIX ソート コマンドは -u オプションをサポートしています。これは、すべてのキーで等しいと比較される 2 つの行のうち最初の行のみを保持します。
sort -k1 your_file | awk '{ if ($1 != last_address_seen) {print $0; last_address_seen=$1}}'