sorting - AWK / sort / uniq を使用して、単純なテキストファイルから最初の列に同じ値を持つ行を削除する方法について、迅速なサポートが必要です

Question

column1 と column2 (スペースで区切られている) に次の内容のテキストファイルがたくさんあります。

アドレス0 データ0

アドレス1 データ1

.

アドレスN データN

すべてのデータ値は一意 (ランダム) ですが、一部のアドレス値は繰り返されます。AWK / sort / uniq を使用して、既に指定されているアドレスを持つ行を削除するにはどうすればよいですか?

基本的に、関連するデータが何であれ、テキストファイル内に重複するアドレスがあってはなりません。

score 1 · Accepted Answer

1

awk '
    $1 in seen {next}
    {print; seen[$1] = 1}
' file ...

于 2010-11-11T14:41:49.520 に答える

score 0 · Accepted Answer

sort -k1 -u your_file > outputfile

ほとんどの UNIX ソートコマンドは -u オプションをサポートしています。これは、すべてのキーで等しいと比較される 2 つの行のうち最初の行のみを保持します。

score 0 · Accepted Answer

0

sort -k1 your_file | awk '{ if ($1 != last_address_seen) {print $0; last_address_seen=$1}}'

于 2010-11-11T13:26:39.890 に答える

sorting - AWK / sort / uniq を使用して、単純なテキスト ファイルから最初の列に同じ値を持つ行を削除する方法について、迅速なサポートが必要です