緯度と経度の情報を含むデータがいくつかありますが、ほとんどのデータ ポイントは地理的に密集しており、代表的ではありません。これらのデータ セットから均一に分布する代表的なサブセットを選択したいと考えています。
以下は私のデータの例です
no lon lat
1 121.62 31.18
2 121.91 30.90
3 121.76 31.11
4 121.49 31.12
... ...
私はいくつかの情報をチェックし、緯度と経度をグループ化することを学び、ピアソンカイ二乗検定を使用しましたが、SQL の使用に慣れていません。
そのようなサブセットを取得するためのSQLコードを取得するか、SQLを使用して均等な分散メソッドを取得したいと考えています。