似たような旅をまとめるために、1000 以上の車の旅を互いに比較する方法を見つけようとしています。(できればRで)
以下の例では、各行は特定の日の 1 人の移動です。
各列は、車が停止したポイントを表します。時間は考慮されず、旅が行われた順序のみが考慮されます。例: stop1、stop2、stop3 ... stop10
すべての旅程に 10 回の停車地があるわけではないため、データには NA が含まれます。
例: マトリックス (row.names は一意の人物を表します):
row.names, stop1, stop2, stop3, stop4, stop5, stop6 ... stop10
1 34 23 16 283 12 453 ...
2 34 23 16 283 12 453 ...
3 34 23 16 122 12 NA ...
4 62 72 90 11 NA NA ...
5 62 90 11 NA NA NA ...
6 46 39 46 83 73 3 ...
クラスタリングは初めてですが、別のタイプ (Kmeans、階層) を調べました。
ヒートマップと平行座標を使用してみましたが、探しているビジュアルが得られませんでした。つまり、1000 以上のジャーニーを持つグループを確認するのは簡単ではなく、似ている可能性のあるジャーニーではうまく機能しないと思います。他の。
誰かがこれに似たデータをクラスター化した場所の例を提供し、それを説明して、初心者にとって明確になるように助けてくれることを願っていますか?
どうもありがとう