私はサッカー サイトから選手の表と個々の選手のプロフィールへのリンクをこすり取ろうとしています。Chrome を使用Inspect element
して xpath を取得しましたが (それは良い考えですか?)、まだ結果が得られません。
ウェブページはリバプールのページです。以下は、プレーヤー テーブルと各プレーヤー プロファイルへのリンクの両方をスクレイピングしようとする試みです。
require(XML)
team_name <- "Liverpool"
url <- paste("http://www.football-lineups.com/team/", team_name,
"/Champions_League_2004_2005/Stats/Most_Capped/", sep='')
url.data <- htmlParse(url)
table <- xpathApply(url.data,
'//*[@id="mainarea"]/tbody/tr/td[1]/table[2]', xmlValue)
links <- xpathApply(url.data,
'//*[@id="mainarea"]/tbody/tr/td[1]/table[2]/tbody/tr[2]/td[2]/a/@href', xmlValue)
table #NULL
links #NULL
編集: ただし、Web ページ上のすべてのリンクを破棄しても問題ありません。私は上で何か間違ったことをしなければなりません!
links2 <- xpathSApply(url.data, "//a/@href")
links2 # a bunch of links