1

私は、NFL統計Webサイトのすべてのゲームのボックススコアデータを通過するループをRに組み込むことを検討しています:http ://www.pro-football-reference.com/years/2012/games.htm

現時点では、毎週すべてのゲームの「ボックススコア」リンクを手動でクリックする必要があります。Rでこれを自動化する方法はありますか?私のコードは、各リンク内の完全な実況データセットで機能します。今は年をとっています!

4

1 に答える 1

2

Webスクレイピングは、一部のWebサイトの使用条件に違反する場合があります。これらの用語の強制力は不明確です。多くの場合、元の表現を完全に複製することは違法ですが、米国では、裁判所は、事実の複製は許可されているとFeistPublicationsv。RuralTelephoneServiceで裁定しました。

require(RCurl)
require(XML)
bdata<-getURL('http://www.pro-football-reference.com/years/2012/games.htm')
bdata<-htmlParse(bdata)
boxdata<-xpathSApply(bdata,'//a[contains(@href,"boxscore")]',xmlAttrs)[-1]

上記は、さまざまなゲームのボックススコアステムを取得します。

于 2012-12-11T12:01:55.170 に答える