ヒストグラムを作成する必要がある大規模なデータセットを使用しています。リスト全体を調べて、2番目の配列で頻度をマークするという私の方法は、遅いアプローチのように感じます. プロセスをスピードアップする方法について何か提案はありますか?
1 に答える
2
ヒストグラムは、各ビン内のすべてのアイテムの数を含むグラフであるため、すべてのアイテムにアクセスせずに作成することはできません。
ただし、次のことができます。
データを収集しながらヒストグラムを作成します。その後、生成に時間がかかりません。
データを N 個の部分に分割し、各部分を並行して処理します。各パーツのカウントが完了したら、各ビンの結果を合計します。(#1と組み合わせることもできます)
データをサンプリングします。理論的には、データの一部を見て、残りの部分を推定できるはずです。 数学。
于 2013-08-03T23:00:20.860 に答える