2012 年から、8187 の郵便番号 (および列としてリストされている約 10 の変数) に対して 8187 行のドイツのデータ フレームを取得しましたが、座標はありません。さらに、8203行の別のシェープファイルの座標を取得しました(ほとんど同じ郵便番号も含まれています)。
初期データ フレームの 8178 ケースに割り当てるには、8203 ケースの正しい座標が必要です。
問題: 必要な正しい割り当ての違いは、8178 ではなく、16 のケースが欠落している (8203 - 8187 = 16)、それ以上です。2012 年のいくつかの町 (郵便番号付き) は、最新のシェープファイルにはリストされていませんが、その逆も同様です。
(I) おそらく最も簡単な解決策は、2012 年の座標を取得することです (投影されていない: CRS("+init=epsg:4326")
)。--> この目的のためのオープン ソース プラットフォームを知っている人はいますか? そして、郵便番号は正確に 8187 ですか?
(II) または: から別の年のデータ セットに座標を割り当てた経験がある人はいますか? - または、境界線と座標がわずかに変更されているため (特に、2012 年からデータをマップしてポリゴンで視覚化する必要がある場合)、新しいデータ セットの古い "and" にリストされていない町があるため、これを回避する必要がありますか?
この問題にアプローチする (そしてできれば解決する) 方法について、専門家のアドバイスをいただければ幸いです。
編集 - MWE:
# data set from 2012
> df1
# A tibble: 9 x 4
ID PLZ5 Name Var1
<dbl> <dbl> <chr> <dbl>
1 1 1067 Dresden 01067 40
2 2 1069 Dresden 01069 110
3 224 4571 Rötha 0
4 225 4574 Deutzen 120
5 226 4575 Neukieritzsch 144
6 262 4860 Torgau 23
7 263 4862 Mockrehna 57
8 8186 99996 Menteroda 0
9 8187 99998 Körner 26
# coordinates of recent shapefile
> df2
# A tibble: 9 x 5
ID PLZ5 Name Longitude Latitude
<dbl> <dbl> <chr> <dbl> <dbl>
1 1 1067 Dresden-01067 13.71832 51.06018
2 2 1069 Dresden-01069 13.73655 51.03994
3 224 4571 Roetha 12.47311 51.20390
4 225 4575 Neukieritzsch 12.41355 51.15278
5 260 4860 Torgau 12.94737 51.55790
6 261 4861 Bennewitz 13.00145 51.51125
7 262 4862 Mockrehna 12.83097 51.51125
8 8202 99996 Obermehler 10.59146 51.28864
9 8203 99998 Koerner 10.55294 51.21257
したがって、
4 225 4574 Deutzen 120
--> df2 にリストされておらず、次の場合:
6 261 4861 Bennewitz 13.00145 51.51125
--> df1 には記載されていません。
(I)と(II)に関するアイデアはありますか?