R でのデータ処理について質問があります。2 つのデータセットがあります。どちらも元は .csv ファイルです。2 つのサンプル データセットを用意しました。
表 A - 人物
http://pastebin.com/HbaeqACi
表 B - 都市
http://pastebin.com/Fyj66ahq
読み込みと視覚化に対応する R コードの作業をできるだけ少なくするためです。
# Read csv files
# check pastebin links and save content to persons.csv and city.csv.
persons_dataframe = read.csv("persons.csv", header = TRUE)
city_dataframe = read.csv("city.csv", header = TRUE)
# plot them on a map
# load used packages
library(RgoogleMaps)
library(ggplot2)
library(ggmap)
library(sp)
persons_ggplot2 <- persons_dataframe
city_ggplot2 <- city_dataframe
gc <- geocode('new york, usa')
center <- as.numeric(gc)
G <- ggmap(get_googlemap(center = center, color = 'color', scale = 4, zoom = 10, maptype = "terrain", frame=T), extent="panel")
G1 <- G + geom_point(aes(x=POINT_X, y=POINT_Y ),data=city_dataframe, shape = 22, color="black", fill = "yellow", size = 4) + geom_point(aes(x=POINT_X, y=POINT_Y ),data=persons_dataframe, shape = 8, color="red", size=2.5)
plot(G1)
その結果、すべての都市と人を視覚化する地図ができました。
私の問題:すべての人は、これら 3 つの都市にのみ分散しています。
私の質問:
- より一般的な質問: これは R の問題ですか?
- ある地点の人数を可視化したバブルマップのようなものを作りたいです。例: A 市には 20 人、B 市には 5 人。都市 A の位置は、都市 B よりも大きなバブルになるはずです。
- 特定の位置にいる人数を示すラベルを作成したいと考えています。私はすでにggplo2
geom_text
オプションでこれを実現しようとしましたが、特定の位置ですべてのポイントを合計してラベルに書き込む方法がわかりません。 - より理論的なアプローチ (後でこれに戻るかもしれません): 人口が最も多い地域を示す密度マップ/クラスター マップのようなものを作成したいと考えています。使用できるいくつかのパッケージを既に検索しています。提案されたものは、SpatialEpi、spatstat、および DCluster でした。私の質問: クラスター分析を実行するには、人から特定のオブジェクト (スーパーマーケットなど) までの距離が必要ですか?
うまくいけば、これらはあまり多くの質問ではありませんでした.
どんな助けでも大歓迎です。前もって感謝します!
ところで: サンプル データセットを含む質問を準備するためのより良いヘルプはありますか? ファイルをどこかにアップロードする必要がありますか、それともペーストビンの方法で問題ありませんか?