GPS データを使用して、トラックから個人的に意味のある場所を発見しています。データをクラスター化し、各ポイントをクラスターに割り当てると、他の列の中にタイムスタンプとクラスター ID の列がある出力ファイルが得られます。人が各クラスターを訪問するたびに滞在した時間を判断するには、データをタイムスタンプで並べ替え、すべて同じクラスターから一連の読み取り値を見つける必要があります。IDパターン1,1,1,2,3,4,4,1,1,2,1,3,3,4,4,1,1,1,1,1があり、それはすでにソートされているとしますタイムスタンプ別 - ここでは、ある人がクラスター 1 を 4 回訪れたことがわかります。私が知りたいのは、その人がクラスター1を訪れるたびに、クラスター1に滞在した時間を計算する方法です。
データの例 (時間は秒単位のエポック時間):
時間 | クラスター
1377997076 | 1
1378000582 | 1
1378000596 | 1
1378031297 | 2
1378031302 | 2
1378031303 | 1
1378031345 | 1
1378033452 | 2
1378034222 | 2
これは、次の 2 次元リストとして表すこともできます。 ,1],[1378033452,2],[1378034222,1]]