ジオポイントの数を減らすために使用できる便利なアルゴリズムはありますか?
独自のジオポイントが付属する 2,000,000 の郵便番号のリストを使用しています。それらを使用して、オフラインで使用する API からデータを収集しています。プログラムは C++ で書かれています。
各郵便番号を調べて、郵便番号の位置に基づいて境界ボックスを計算し、それを API に送信して、その郵便番号に近いデータを取得する必要があります。
ただし、2,000,000 を処理するには多くの郵便番号があり、いくつかの郵便番号は互いに隣り合っているか、同じデータの一部を共有するほど十分に接近しています。
これまでのところ、それらを減らすことができる2つの方法を思いつきましたが、うまくいくかどうかはわかりません:
1 - プログラムはデータ構造を使用してどの郵便番号が重複しているかを記録し、ルーチンを数回実行して、郵便番号が重複していないものがなくなるまで、重複するものを 1 つずつ削除します。
- 英国の左上のジオ ポイントから開始し、英国全体をカバーするまで、郵便番号エリアのおおよそのサイズをゆっくりと増やします。
これらの郵便番号の数を減らして、可能な限り重複しないようにする簡単な方法はありますか? 可能な限り英国全体をカバーするデータを取得するようにしますか? 私は、人々が他の場所で使用する、これに便利なアルゴリズムがあるかもしれないと考えていました。