AWKを使用して数値データの列の中央値を計算するにはどうすればよいですか?
私は単純なアルゴリズムを考えることができますが、それをプログラムすることはできないようです:
私がこれまでに持っているのは:
sort | awk 'END{print NR}'
そして、これは私に列の要素の数を与えます。これを使って特定の行を印刷したいと思い(NR/2)
ます。が整数でない場合NR/2
は、最も近い整数に切り上げ、それが中央値です。それ以外の場合は、との平均を取り(NR/2)+1
ます(NR/2)-1
。