グラフに表示する必要があるデータ ポイント (倍精度) の大規模なデータ セット (数十億) があります。すべてのデータを一度に表示するのは役に立たないため、セット全体から最適な N ポイントを選択するのに役立つアルゴリズムを探していました。
現在、データセットを減らすために系統的サンプリングを行っています。それを改善する方法について何か提案はありますか?ありがとう。
更新: データは、波形の振幅を示す 16 ビットの符号付き数値です。そのため、値は -32,768 から 32,767 の範囲になります。セット全体から表示するために選択された N ポイントがセット全体の近似値を与えるように、ピークと谷をキャプチャしたいと考えています。