ここで問題を解決するために多くの時間を費やしてきましたが、残念ながらまだ運がありませんでした。誰かが私を正しい方向に向けてくれることを願っています。
以下のスクリプトで提供されているリンクにリストされているすべてのプロパティの住所要素を抽出しようとしています。ただし、出力は常に空のリストです。さまざまなバリエーションを試しましたが、うまくいきませんでした。
lapply(c('XML','httr'),require,character.only=TRUE)
link <- "http://www.realtor.ca/Map.aspx?CultureId=1&ApplicationId=1&RecordsPerPage=9&MaximumResults=9&PropertyTypeId=300&TransactionTypeId=2&SortOrder=A&SortBy=1&LongitudeMin=-114.52066040039104&LongitudeMax=-113.60536193847697&LatitudeMin=50.94776904194829&LatitudeMax=51.14246522072541&PriceMin=0&PriceMax=0&BedRange=0-0&BathRange=0-0&ParkingSpaceRange=0-0&viewState=m&Longitude=-114.063011169434&Latitude=51.0452194213867&ZoomLevel=11&CurrentPage=1#CultureId=1&ApplicationId=1&RecordsPerPage=9&MaximumResults=9&PropertyTypeId=300&TransactionTypeId=2&SortOrder=A&SortBy=1&LongitudeMin=-114.9913558959965&LongitudeMax=-113.1346664428715&LatitudeMin=50.91552869934793&LatitudeMax=51.1745480567661&PriceMin=0&PriceMax=0&BedRange=0-0&BathRange=0-0&ParkingSpaceRange=0-0&viewState=l&Longitude=-114.063011169434&Latitude=51.0452194213867&ZoomLevel=11&CurrentPage=1"
doc <- htmlTreeParse(link,useInternalNodes = T)
addresses <- xpathSApply(doc,"//div[@id='listView']//span",xmlValue)
の出力は次のaddresses
とおりです。
> addresses
list()
実際、上記のリンクの他の html 要素は取得できませんでした。最初に完全にロードする機会を与えずに、ページのロードに時間がかかるGET{httr}
か、Webページを瞬時にスクレイピングするためでしょうか. htmlTreeParse{XML}
私の推論が理にかなっているのかどうかはわかりません。この問題に関するコミュニティの支援に感謝します。