XML、RCurl、または httr ライブラリを使用して、R で次の Web ページをスクレイピングしようとしています: http://accuscore.com/fantasy-sports/nfl-fantasy-sports/Rest-of-Season-RB
ブラウザで Web ページが正しく開きます。Webページをスクレイピングする私の試みは次のとおりです。
library("XML")
#this works fine (QB projections)
qb <- readHTMLTable("http://accuscore.com/fantasy-sports/nfl-fantasy-sports/", header=1)$fantasy_table
#this does not (RB projections)
rb <- readHTMLTable("http://accuscore.com/fantasy-sports/nfl-fantasy-sports/Rest-of-Season-RB", header=1)$fantasy_table
library("RCurl")
htmlParse("http://accuscore.com/fantasy-sports/nfl-fantasy-sports/Rest-of-Season-RB")
library("httr")
GET("http://accuscore.com/fantasy-sports/nfl-fantasy-sports/Rest-of-Season-RB")
readHTMLTable と htmlParse で次のエラーが表示されます:「エラー: HTTP リソースの読み込みに失敗しました」。GET を使用すると、ステータス コード 404 を受け取ります。これは、リソースが見つからず、リクエストの送信方法に誤りがある可能性があることを示しています。ブラウザで Web ページを開くことができるので、何が問題なのかわかりません。たぶん、関数が期待しているファイルとは異なる種類のファイルですか? 何か案は?
理想的には、スクレイプは (最初の 25 エントリだけでなく) 146 エントリすべてに対して行われます。