1

このページから統計をスクレイピングしたい:

url <- "http://www.pgatour.com/players/player.20098.stuart-appleby.html/statistics"

具体的には、Stuart の顔写真の下にあるテーブルのデータを取得したいと考えています。「スチュアート・アップルビー - 2015 STATS PGA TOUR」の見出しです。

rvestをSelector Gadget ( http://selectoradget.com/ ) と組み合わせて使用​​しようとしています。

url_html <- url %>% html()
url_html %>% 
        html_nodes(xpath = '//*[(@id = "playerStats")]//td')

たとえば、「Recap -- Rank -- Additional Stats」という行が一番上にないテーブルを取得する必要があります

url_html <- url %>% html()
url_html %>% 
    html_nodes(xpath = '//*[(@id = "playerStats")] | //th//*[(@id = "playerStats")]//td') 

「Recap -- Rank -- Add'l Stats」という行を含むテーブルを取得する必要があります。

どちらもしません。

Webスクレイピングに関しては、私はまったくの初心者です。その Web ページの [ソースを表示] をクリックすると、テーブルに含まれるデータが表示されません。

テーブルが開始されるべきだと思うソースコードには、次のコードがあります。

<script id="playerStatsTourTemplate" type="text/x-jquery-tmpl">
    {{each(t, tour) tours}}
        {{if pgatour.players.shouldProcessTour(tour.tourCodeLC)}}
        <div class="statistics-head">
            <h2 class="title">Stuart&nbsp;Appleby - <b>${year} STATS 
.
.
.

そのため、関数にアクセスできない場所にテーブルが格納されているようです (Json? Jquery? Javascript? これらの用語はここで適用されますか?) html()rvestこのデータを取得するために使用する方法はありますか? rvestこの方法で保存されているデータを取得するのに相当するものはありますか?

ありがとう。

4

2 に答える 2