モバイル デバイス (iphone) から GPS データを受信するサーバーがあり、データの送信元となる都市を日ごとに特定します。. アプリは 3 時間ごとに同期します。私が必要とする粒度はそれほど小さくないので、都市よりも「小さい」ものには興味がありません. 問題は、GPS のウォームアップ、精度の悪さ、および膨大な量の受信データ (デバイスは 10 分ごとにデータを収集し、3 時間ごとにサーバーと同期する) により、誤検知や不良データが発生することがあることです。近くに住んでいるユーザーがいます。ニューヨーク/ニュージャージー州の国境と私は、彼が実際の一日のほとんどを国境から遠く離れた場所で過ごしているにもかかわらず、別の場所から別の場所を取得し続けているため、彼が家にいる時間は重要ではありません)。
私の質問は、n 時間ごとに同期されるデータのノイズと誤検知を取り除くのに役立つアプローチを見つけるために、どのアルゴリズムを検討すべきか、どの論文を読むべきか、さらにはどの用語をググるべきかということです。特定のレベル (この場合は都市) よりも詳細である必要はなく、特定の期間に重要なのはどれですか? (これは、異なる都市、州、または国への異なる日付の訪問を数えているという事実と考えてください)。データを「クラスタリング」または「分解」するようなことを考えていましたが、地理アルゴリズムについてはまだ何も知りません;)