大量のデータを生成するプログラムを書いています。そのデータのさまざまなパーセンタイルを見つけたいと思います。
これを行うための明白な方法は、データをある種のソートされたコンテナに格納することです。自動的にソートされ、任意のインデックスへの高速ランダム アクセスを提供するコンテナを提供する Haskell ライブラリはありますか?
別の方法として、順序付けされていないコンテナーを使用し、最後に並べ替えを実行することもできます。それがもっと速くなるかどうかはわかりません。いずれにせよ、高速なランダム アクセスを提供するコンテナーが必要なままです。(配列、おそらく...)
提案?
(もう 1 つの方法は、データ セット全体をメモリに保持するのではなく、ヒストグラムを作成することです。しかし、目的はパーセンタイルを非常に正確に計算することであるため、その方法をたどりたくありません。また、自分の範囲もわかりません。データを生成するまで...)