python - html フレームからデータを取得する

Question

このhtmlフレームでテーブル情報を取得しようとしています。列を持つテーブルを意味します：

Year,Month,Oil Production m3,Gas Production Ksm3,...

を使用してbeautifulSoup、これはこれまでのところ私が試したことです:

from bs4 import BeautifulSoup
from urllib import urlopen, urlretrieve, quote

url_base = 'https://www.og.decc.gov.uk/information/wells/pprs/Well_production_onshore_oil_fields/onshore_oil_fields_by_well/onshore_oil_fields_by_wel.html'
u = urlopen(url_base)
html = u.read().decode('utf-8')
u.close()
soup = BeautifulSoup(html)

ただし、これはページフレームではなく、メインページ情報のみを取得します。フレームリンクで URL ベースを変更すると、要求されたページが古くなっていることがわかります。

score 1 · Accepted Answer

間違った URL をコピーしていると思います。以下を使用すると、うまくいきました。

url_base = 'https://www.og.decc.gov.uk/information/wells/pprs/Well_production_onshore_oil_fields/onshore_oil_fields_by_well/0.htm'

注意: それは.../onshore_oil_fields_by_well/0.htm、

それ以外の.../onshore_oil_fields_by_well/0.html

python - html フレームからデータを取得する

1 に答える 1

Related

Reference