私の仕事は、できるだけ多くのフラットセルオファーをダウンロードすることです。リンクなどをダウンロードするためのスクリプトがありますが、フラットの座標を取得できません(これは私にとって非常に重要であり、分析の要点です)。
座標はウェブサイトに表示されますが(グーグルマップ要素をチェックすることにより)、ウェブサイトのソースには表示されません。
以下のRコードを使用すると、空のリストが表示されます。XMLまたはRCurlパッケージを使用しても違いはありません。
Rを使用してこれを達成することは可能だと思いますか、それとも他のプログラミング言語(Pythonなど)について考えるべきですか?)
library(XML)
library(RCurl)
url<-'http://en.otodom.pl/flat-poznan-jezyce-2720m2-2-rooms-125000-pln-id13250586.html'
doc<-htmlParse(url,encoding='utf-8')
xpathApply(doc,'//div[@id="googleMap"]',xmlGetAttr,'data-map')
#the same result
doc<-getURL(url, httpheader = c('User-Agent' = "Informative string with your contact info"),.encoding='utf-8')
doc<-htmlParse(doc,encoding='utf-8')
xpathApply(doc,'//div[@id="googleMap"]',xmlGetAttr,'data-map')
# the same here
doc<-getURL(url, followlocation=T)
doc<-htmlParse(doc,encoding='utf-8')
xpathApply(doc,'//div[@id="googleMap"]',xmlGetAttr,'data-map')