-1

タクシーの位置を含む一連のシーケンスがあります。データ行の連続パターンを考慮して、データをクラスター化します。例: T1、T2、T3、T4 はトラベルで、a、b、c、d、e は一連の場所です。私たちが持っているデータは次のようなものです。

  • T1 bcbad
  • T2a
  • T3 衰弱
  • T4 bcdcbdca

しかし問題は、データの長さが可変ではないことです。EM を使用してこれらのタイプのデータをクラスター化するにはどうすればよいでしょうか。可変長データを受け入れないため、カスタマイズする方法があります。

4

1 に答える 1

1

EM は一般原則です。非常に異なるモデルで使用できます。

おそらく、EM の最も一般的なモデルはガウス混合モデリング(GMM) です。

当然、共分散を使用する場合、GMMには固定次元が必要です。

しかし、他のモデルを使用する場合、可変長ベクトルで動作しない理由はありません。たとえば、テキスト データを処理する EM バリアントがあり、通常、テキストの長さは異なります。

于 2015-08-25T11:03:18.263 に答える