サンプルコードは次のようになり、最初の列が表示された回数の統計を実行し、結果を並べ替えます。
{ dist[$1]+=1; }
END { for (i in dist) {
print i,dist[i] | "sort"
}
}
私の意見では、プロセスは次のようになります。
(ワークフローA)
1)内のすべての要素を出力しdist、それらすべてをバッファに保存します
2)バッファ内のすべての要素を取得し、それらをパイプしてsort機能させる
ただし、上記の例では、プロセスは次のようになります。
(ワークフローB)
1)に1つの要素を出力しdist、それをパイプしてsort機能させる
2)distの新しい要素がなくなるまで、の次の要素を処理しますdist
私はなぜ私がsortこのようなものを置くべきではないのか疑問に思いました:
{ dist[$1]+=1; }
END { for (i in dist) {
print i,dist[i]
}
| "sort"
}
誰かがその理由について何か考えがありますか?そして、pipe私がそのような仕事をしたいのであれば、どうすれば書くことができWORKFLOW Bますか?
ありがとう!