awk - 2 つのファイルの類似性の変更と比較

Question

私は2つのファイルを持っています。file1のサンプル値は次のとおりです。

file2のサンプル値は次のとおりです。

file1を変更して、次の値でfile3を作成しようとしています (ご覧のとおり、file1の最後の列の値は無関係です)。

また、file2を変更する必要があり、次の値でfile4を作成する必要があります ( file2の最後の列の値は関係ありません)。

file3とfile4を作成したら、 diffユーティリティを使用して類似性を確認します。file3とfile4を生成するために、awkスクリプトを作成しようとしています。しかし、の初心者としてawk、私はこの作業に非常に時間がかかると感じています. ガイダンスをいただければ幸いです。

score 1 · Accepted Answer

最初の行から値を取得し、$1それを数式で使用してオフセットを計算できます。これは、最小$1が最初の行にあると想定しています。

awk 'NR==1 { i=$1 } { print $1-i+1,$2 }'

たとえば、次のことができます。

awk 'NR==1 { i=$1 } { print $1-i+1,$2 }' file1 > file3
awk 'NR==1 { i=$1 } { print $1-i+1,$2 }' file2 > file4
diff file3 file4

これは、あなたが本当にオフセットを探していることに気付く前の私の以前のバージョンでした. の変更に基づいて変更したいだけだと思っていました$1。行間の値の変化をチェックするために使用する変数を設定し、変化した場合にのみカウンターをインクリメントできます$1。これは、グループ化されていることを前提としています。

awk 'n!=$1 { i++ } { print i,$2 } { n=$1 }'

たとえば、次のことができます。

awk 'n!=$1 { i++ } { print i,$2 } { n=$1 }' file1 > file3
awk 'n!=$1 { i++ } { print i,$2 } { n=$1 }' file2 > file4
diff file3 file4

awk - 2 つのファイルの類似性の変更と比較

1 に答える 1

Related

Reference