0

シナリオがあります:いくつかのGPSトラック(経度、緯度)のデータがあり、これらは2つの部分に含まれています

旅の駅であるデータ(経度と緯度)を含む最初の部分(これらは実際の座標であり、バスが旅を始めるときに訪問する必要があります)

GPS座標(経度と緯度)を含む2番目の部分ですが、おそらく1番目の部分の2倍です。バスが旅を始めるたびに、バスはこれらの駅を停止します(誰の座標が与えられているか)。訪問したGPSステーション(リアルタイム座標)を最初の部分(スケジュールされた座標)と比較することによって、そのバスが旅を完了したかどうかを比較したいと思います。

しかし、私の問題:

私は2番目の部分にほぼ2つの座標を持っており、それらはすべて互いに非常に近く、ほぼ5〜8の座標が同じ測点を表しています。(例:104578,105888)および(104579,105890)

ある特定のcoordiantesが同じ駅を代表していないことを宣言するための正しくて可能な方法は何でしょうか。この問題は、おそらくK最近傍法またはK平均法を使用して解決できます。

この問題は明確に定義されていないようです。しかし、クエリについてはもっと説明しようと思います。

4

3 に答える 3

1

緯度経度ペアで空間インデックスを使用できます。次に、曲線上の近い点を探して、それらをグループ化できます。空間インデックスは、多くの場合、空間充填曲線または四分木です。quadkey を使用して 2 次元にインデックスを付け、それを 1 次元に減らします。また、いくつかの空間情報を保持し、多くのことに使用できます。詳細については、Nick の空間インデックス quadtree hilbert ブログを参照してください。

于 2012-11-25T18:13:27.443 に答える
0

2 番目の部分の座標の凸包ポリゴンをおそらくバッファーを使用して作成し、GPS エラーを考慮してポイント イン ポリゴン検索を実行できるように、より広い領域を使用します。

または、スケジュールされたポイントを中心として半径距離を使用します。

于 2012-11-25T16:20:21.193 に答える
0

単純なしきい値処理アプローチの使用を検討しましたか? つまり、特定の距離で座標をマージしますか? そのようなしきい値を非常にうまく選択できるようです。

クラスタリングの問題は、データセット内の構造を発見しようとすることです。

あなたが興味を持っているように見えるのは、特定の距離内にあるオブジェクトの単純なマージです。発見したい「構造」はありません。クラスタリングではなく、前処理を行いたい。

于 2012-11-25T19:06:50.640 に答える