私はウェブページを持っています: http://kff.org/womens-health-policy/state-indicator/ultrasound-requirements/# このウェブページからテーブルを抽出する必要があります.
問題が発生しました: 私は BeautifulSoup を使用しており、URL コンテンツを取得するための要求を行っています。これらの方法の問題は、テーブルが生成される前でも Web コンテンツを取得できることです。
だから私は空のテーブルを取得します < table> < thead> < /thead> < tbody> < /tbody> < /table>
私のアプローチ: webbrowser.open_new_tab(url) を使用してブラウザーで URL を開こうとしています。次に、ブラウザーから直接コンテンツを取得します。これにより、サーバーがテーブルを更新できるようになり、ページからコンテンツを取得できるようになります。
問題: Web ブラウザから直接情報を取得する方法がわかりません。
現在、Windows システムで Mozilla を使用しています。
最も近いリンクはウェブサイトのリンクを見つけました。ただし、コンテンツではなく、どのサイトが開かれているかを示します
テーブルを urllib2 または beautifulsoup と requests にロードさせる他の方法はありますか? または、読み込まれたコンテンツを Web ページから直接取得する方法はありますか。
ありがとう