実際の世界の大統領の地図を作りたいです。
このために、ウィキペディアから各大統領の画像をスクレイピングしたいと思います。
最初のステップは、wiki ページからデータを取得することです: http://en.wikipedia.org/wiki/List_of_current_heads_of_state_and_government
テーブルに行スパンがあるため、国名と大統領ページの URL を取得できません。
今のところ、私のコードは以下のようになっていますが、行がまたがっているためうまくいきません..
library(XML)
u = "http://en.wikipedia.org/wiki/List_of_current_heads_of_state_and_government"
doc = htmlParse(u)
tb = getNodeSet(doc, "//table")[[3]]
stateNames <- readHTMLTable(tb)$State
presidentUrls <- xpathSApply(tb, "//table/tr/td[2]/a[2]/@href")
どんなアイデアでも大歓迎!
マット