1

BeautifulSoup を使用して Web ページからデータを取得しています。Web ページには日付が表示されます。これは、Firefox でページを開くと表示されます。ただし、ページのソースを表示すると、日付は表示されず、日付を生成する JavaScript のみが表示されます。ここには関連する質問がいくつかあります。ajax と json への参照があります。これは、必要な日付を含む JavaScript コードを含む HTML コードの一部です。

<div class="match-details">
  <p class="floatleft">
    BARCLAYS PREMIER LEAGUE 

    <span>
      <script type="text/javascript">
        (function(){
        var d = new Date(1345489200000);

        var year = d.getFullYear();
        var month = d.getMonth() + 1;
        var day = d.getDate();
        var minutes = d.getMinutes();
        var hours = d.getHours();                                        

        if (minutes < 10) { minutes = '0' + minutes; }
        var dmy = [day, month, year];
        var hm = [hours, minutes];
        if (SITE_EDITION == 'us/en') {
            var dmy = [month, day, year];    
        }
        var matches_local = dmy.join('/') + " " + hm.join(':'); 
        matches_local += "<span class='live-red'>*</span>";

        document.write(matches_local);
        })();                                                       
      </script>
    </span>

  </p>
</div>
4

1 に答える 1

2

BeautifulSoupHTML処理ライブラリです。HTML + Javascript 処理ライブラリが必要です。

この質問を読んでください : JavaScript を使用したプログラマティック Python ブラウザ

そのQAが述べているように...基本的には、Seleniumを介して実際のブラウザを使用するか、Spynnerのようなjavascriptをサポートするpythonブラウザを使用する必要があります。

于 2013-03-01T20:32:14.260 に答える