0

似たような旅をまとめるために、1000 以上の車の旅を互いに比較する方法を見つけようとしています。(できればRで)

以下の例では、各行は特定の日の 1 人の移動です。

各列は、車が停止したポイントを表します。時間は考慮されず、旅が行われた順序のみが考慮されます。例: stop1、stop2、stop3 ... stop10

すべての旅程に 10 回の停車地があるわけではないため、データには NA が含まれます。

例: マトリックス (row.names は一意の人物を表します):

row.names, stop1, stop2, stop3, stop4, stop5, stop6 ... stop10
    1        34     23     16    283     12    453  ...   
    2        34     23     16    283     12    453  ...   
    3        34     23     16    122     12    NA   ...   
    4        62     72     90    11      NA    NA   ...   
    5        62     90     11    NA      NA    NA   ...   
    6        46     39     46    83      73    3    ...   

クラスタリングは初めてですが、別のタイプ (Kmeans、階層) を調べました。

ヒートマップと平行座標を使用してみましたが、探しているビジュアルが得られませんでした。つまり、1000 以上のジャーニーを持つグループを確認するのは簡単ではなく、似ている可能性のあるジャーニーではうまく機能しないと思います。他の。

誰かがこれに似たデータをクラスター化した場所の例を提供し、それを説明して、初心者にとって明確になるように助けてくれることを願っていますか?

どうもありがとう

4

1 に答える 1

0

データセットは場所で構成されているため、地理的な次元があります。数値 ID を見るだけでなく、それらの各ポイントの座標を取得してプロットします。これはおそらく、単純なクラスタリングよりもはるかに有益です。


あるいは、ジオコーディングが実行不可能な場合は、これをアソシエーション ルール (マーケット バスケット分析) の問題として扱うことができます。各トリップはバスケットを表し、ロケーション ID は各バスケットに存在するアイテムです。

于 2013-10-27T14:40:55.433 に答える