ウィキペディア内のオリンピック 2012 のメダル テーブルを取得しようとしています。
library(rvest)
library(magrittr)
url <- "https://en.wikipedia.org/wiki/United_States_at_the_2012_Summer_Olympics"
xpath0 <- '//*[@id="mw-content-text"]/table[1]'
xpath1 <- '//*[@id="mw-content-text"]/table[2]'
xpath2 <- '//*[@id="mw-content-text"]/table[2]/tbody/tr/td[1]'
xpath3 <- '//*[@id="mw-content-text"]/table[2]/tbody/tr/td[1]/table'
tb <- url %>%
html() %>%
html_nodes(xpath=xpath0) %>%
html_nodes("") %>%
html_table()
xpath0 または xpath1 がエラーを返す
Error in parse_simple_selector(stream) :
Expected selector, got <EOF at 1>
xpath2 と xpath3 は空のリストを返します。
同時に、正確な要素を指すためにSelectorgadget ( https://cran.r-project.org/web/packages/rvest/vignettes/selectorgadget.html ) を使用しようとしました。私は得た
//td[(((count(前の兄弟:: ) + 1) = 1) と親:: )] | //*[contains(concat( " ", @class, " " ), concat( " ", "headerSortDown", " " ))]
そしてエラー
parse_simple_selector(stream) のエラー: 予想されるセレクター、取得しました
どんな助けでも本当に感謝しています。
ジョア