0

アプリケーションのフレームタイムをプロットしており、中央値を自動的に計算したいと考えています。k-medians アルゴリズムはまさに私が求めているものだと思いますが、私の問題がどのように適用されるかはわかりません。私のデータ ポイントは等間隔であるため、任意の2Dデータはありませんが、時間次元が重要であるため、 1Dデータだけもありません。

ここに画像の説明を入力

これらのクラスターを計算するにはどうすればよいですか (k 中央値ではなく 2 中央値で十分です)。データは非常にノイズが多い可能性があるため、平均ではなく中央値が必要であり、ノイズがクラスタリングを妨げないようにしたいと考えています。

また、ウィキペディアのK medians clusteringよりも詳細な記事はありますか?

4

1 に答える 1

2

クラスタリングを使用しないでください。

クラスター分析は、実際には多変量データ用に設計されています。

1 次元データは順序付けられているため、根本的に異なります。多変量データではありません。これは、多変量データよりも 1 次元データに対してはるかに効率的なアルゴリズムを構築できることを意味します。

ここでは、時系列セグメンテーションを実行します。自然ブレークの最適化などの方法だけでなく、カーネル密度の推定などの方法も調べたい場合があります。

最も簡単な方法は、標準偏差を追跡し、多数のポイントが標準偏差から大幅に逸脱したら、そこにセグメント化することです。

于 2013-11-13T08:41:28.573 に答える