1

私は次のプロジェクトに取り組んでおり、Hmisc が提供する CurveRep() クラスタリング アプローチを調査しています。(CurveRep は、CLARA クラスタリング アルゴリズムに基づく同様のパターンに従って、個々の被験者の縦方向の成長曲線をクラスタ化します)。CurveRep() を使用した出版物を見つけたことがなく、一般的にインターネット上でそれについての議論がほとんどないため、それについての経験や考えを教えていただければ幸いです! - 私のプロジェクト: 3 つの時点 (0、30、120 分) で n=500 人の被験者について約 200 の代謝物を測定しました。個々の時間経過はかなり異なりますが、スパゲッティ プロットでは、グループがあるように見えます (例: 直線と平坦な曲線、山型の曲線、谷型の曲線)。これらの曲線を 2 つまたは 3 つの代表的な時間経過にクラスター化し、各クラスターに曲線固有の回帰モデルを適合させたいと考えています。CurveRep() はまさに私が探しているものと思われ、許容できるクラスター ソリューションを生成します (ただし、ソリューションはさまざまな成長パターンではなく、さまざまな y 軸の交点に基づいています)。

何かいいことがあるの?同様の縦方向の変化に従ってグループ化する代替のクラスタリング アルゴリズムはありますか (たとえば、クラスター 1 = "線形上昇"、クラスター 2 = "谷型")? どうもありがとう!クリス

4

1 に答える 1

0

3 つの時点は、すべての時系列メソッドを機能させるには少なすぎます。DTW を見てください。これは、はるかに高い解像度用に設計されています。

k-means、PAM、CLARA などのクラスタリング アルゴリズムが有効です。クラスターの中心を見てください。

データをより慎重に前処理する必要がある場合があります。

絶対値ではなく変化に関心がある場合は、それに応じてデータをエンコードしてください。例えば、

x1、x2、x3 -> x2-x1、x3-x2

また

x1,x2,x3 -> x1-mu,x2-mu,x3-mu with mu=(x1+x2+x3)/3

これにより、クラスタリングの結果が動機に一致する可能性が高くなります。

于 2015-04-13T06:18:26.410 に答える