algorithm - パーセンタイルの計算

翻译自：https://stackoverflow.com/questions/17259976 2013-06-23T10:47:54.950

237 次

大量のデータを生成するプログラムを書いています。そのデータのさまざまなパーセンタイルを見つけたいと思います。

これを行うための明白な方法は、データをある種のソートされたコンテナに格納することです。自動的にソートされ、任意のインデックスへの高速ランダムアクセスを提供するコンテナを提供する Haskell ライブラリはありますか?

別の方法として、順序付けされていないコンテナーを使用し、最後に並べ替えを実行することもできます。それがもっと速くなるかどうかはわかりません。いずれにせよ、高速なランダムアクセスを提供するコンテナーが必要なままです。(配列、おそらく...)

提案？

(もう 1 つの方法は、データセット全体をメモリに保持するのではなく、ヒストグラムを作成することです。しかし、目的はパーセンタイルを非常に正確に計算することであるため、その方法をたどりたくありません。また、自分の範囲もわかりません。データを生成するまで...)

1 に答える 1