サンプルコードは次のようになり、最初の列が表示された回数の統計を実行し、結果を並べ替えます。
{ dist[$1]+=1; }
END { for (i in dist) {
print i,dist[i] | "sort"
}
}
私の意見では、プロセスは次のようになります。
(ワークフローA)
1)内のすべての要素を出力しdist
、それらすべてをバッファに保存します
2)バッファ内のすべての要素を取得し、それらをパイプしてsort
機能させる
ただし、上記の例では、プロセスは次のようになります。
(ワークフローB)
1)に1つの要素を出力しdist
、それをパイプしてsort
機能させる
2)dist
の新しい要素がなくなるまで、の次の要素を処理しますdist
私はなぜ私がsort
このようなものを置くべきではないのか疑問に思いました:
{ dist[$1]+=1; }
END { for (i in dist) {
print i,dist[i]
}
| "sort"
}
誰かがその理由について何か考えがありますか?そして、pipe
私がそのような仕事をしたいのであれば、どうすれば書くことができWORKFLOW B
ますか?
ありがとう!