私の仕事には、非常に大きなファイルから多くのフィールドをソートすることが含まれます。私は通常sort
、bash のコマンドでこれを行います。残念ながら、並べ替えを開始すると、どれくらいの時間がかかるかわかりません。結果が表示されるまで少し待つ必要がありますか、それとも実行中に別の作業を開始する必要がありますか?
ソートがどこまで進んだか、またはソートの速度を知る方法はありますか?
$ cut -d , -f 3 VERY_BIG_FILE | sort -du > output
いいえ、GNUsort
は進捗報告を行いません。
ただし、sort
重複を削除するためだけに使用していて、実際には順序を気にしない場合は、よりスケーラブルな方法があります。
awk '! a[$0]++'
これにより、最初に出現した行が表示されるとすぐに書き出されます。これにより、進行状況を把握できます。
バックグラウンドで「ソート」を実行すると、プロンプトが表示され、他のジョブを実行できます
$sort ...... & # (& はバックグラウンドで実行することを意味します)