私は、NFL統計Webサイトのすべてのゲームのボックススコアデータを通過するループをRに組み込むことを検討しています:http ://www.pro-football-reference.com/years/2012/games.htm
現時点では、毎週すべてのゲームの「ボックススコア」リンクを手動でクリックする必要があります。Rでこれを自動化する方法はありますか?私のコードは、各リンク内の完全な実況データセットで機能します。今は年をとっています!
私は、NFL統計Webサイトのすべてのゲームのボックススコアデータを通過するループをRに組み込むことを検討しています:http ://www.pro-football-reference.com/years/2012/games.htm
現時点では、毎週すべてのゲームの「ボックススコア」リンクを手動でクリックする必要があります。Rでこれを自動化する方法はありますか?私のコードは、各リンク内の完全な実況データセットで機能します。今は年をとっています!
Webスクレイピングは、一部のWebサイトの使用条件に違反する場合があります。これらの用語の強制力は不明確です。多くの場合、元の表現を完全に複製することは違法ですが、米国では、裁判所は、事実の複製は許可されているとFeistPublicationsv。RuralTelephoneServiceで裁定しました。
require(RCurl)
require(XML)
bdata<-getURL('http://www.pro-football-reference.com/years/2012/games.htm')
bdata<-htmlParse(bdata)
boxdata<-xpathSApply(bdata,'//a[contains(@href,"boxscore")]',xmlAttrs)[-1]
上記は、さまざまなゲームのボックススコアステムを取得します。