0

ヒストグラムを作成する必要がある大規模なデータセットを使用しています。リスト全体を調べて、2番目の配列で頻度をマークするという私の方法は、遅いアプローチのように感じます. プロセスをスピードアップする方法について何か提案はありますか?

4

1 に答える 1

2

ヒストグラムは、各ビン内のすべてのアイテムの数を含むグラフであるため、すべてのアイテムにアクセスせずに作成することはできません。

ただし、次のことができます。

  1. データを収集しながらヒストグラムを作成します。その後、生成に時間がかかりません。

  2. データを N 個の部分に分割し、各部分を並行して処理します。各パーツのカウントが完了したら、各ビンの結果を合計します。(#1と組み合わせることもできます)

  3. データをサンプリングします。理論的には、データの一部を見て、残りの部分を推定できるはずです。 数学

于 2013-08-03T23:00:20.860 に答える