0

2012 年から、8187 の郵便番号 (および列としてリストされている約 10 の変数) に対して 8187 行のドイツのデータ フレームを取得しましたが、座標はありません。さらに、8203行の別のシェープファイルの座標を取得しました(ほとんど同じ郵便番号も含まれています)。

初期データ フレームの 8178 ケースに割り当てるには、8203 ケースの正しい座標が必要です。

問題: 必要な正しい割り当ての違いは、8178 ではなく、16 のケースが欠落している (8203 - 8187 = 16)、それ以上です。2012 年のいくつかの町 (郵便番号付き) は、最新のシェープファイルにはリストされていませんが、その逆も同様です。

(I) おそらく最も簡単な解決策は、2012 年の座標を取得することです (投影されていない: CRS("+init=epsg:4326"))。--> この目的のためのオープン ソース プラットフォームを知っている人はいますか? そして、郵便番号は正確に 8187 ですか?

(II) または: から別の年のデータ セットに座標を割り当てた経験がある人はいますか? - または、境界線と座標がわずかに変更されているため (特に、2012 年からデータをマップしてポリゴンで視覚化する必要がある場合)、新しいデータ セットの古い "and" にリストされていない町があるため、これを回避する必要がありますか?

この問題にアプローチする (そしてできれば解決する) 方法について、専門家のアドバイスをいただければ幸いです。

編集 - MWE:

# data set from 2012
> df1
# A tibble: 9 x 4
     ID  PLZ5          Name  Var1
  <dbl> <dbl>         <chr> <dbl>
1     1  1067 Dresden 01067    40
2     2  1069 Dresden 01069   110
3   224  4571         Rötha     0
4   225  4574       Deutzen   120
5   226  4575 Neukieritzsch   144
6   262  4860        Torgau    23
7   263  4862     Mockrehna    57
8  8186 99996     Menteroda     0
9  8187 99998        Körner    26

# coordinates of recent shapefile   
> df2
# A tibble: 9 x 5
     ID  PLZ5          Name Longitude Latitude
  <dbl> <dbl>         <chr>     <dbl>    <dbl>
1     1  1067 Dresden-01067  13.71832 51.06018
2     2  1069 Dresden-01069  13.73655 51.03994
3   224  4571        Roetha  12.47311 51.20390
4   225  4575 Neukieritzsch  12.41355 51.15278
5   260  4860        Torgau  12.94737 51.55790
6   261  4861     Bennewitz  13.00145 51.51125
7   262  4862     Mockrehna  12.83097 51.51125
8  8202 99996    Obermehler  10.59146 51.28864
9  8203 99998       Koerner  10.55294 51.21257

したがって、

4   225  4574       Deutzen   120

--> df2 にリストされておらず、次の場合:

6   261  4861     Bennewitz  13.00145 51.51125

--> df1 には記載されていません。

(I)と(II)に関するアイデアはありますか?

4

0 に答える 0