python - シンプルで動的なWebスクレイピング-BeautifulSoupなし

Question

ゲームが更新されるたびにサーバーソフトウェアをダウンロードするために使用できるURLを取得するために、動的なWebサイトをスクレイプしようとして忙しいです。

このサイトは「http://craftstud.io/builds」で、「ServerXX.XXX」と書かれているところが私がこすり取ろうとしているものです。

Javascriptや外部モジュールで複雑になりたくないので、簡単な解決策があれば私はすべての耳です。

また、BeautifulSoup（Stupid Windows）などのサードパーティ製モジュールをインストールすることもできません。

皆さんありがとう！

score 3 · Accepted Answer

単純なものが必要な場合は、単純な正規表現の使用を検討してください。

>>> import re
>>> import urllib2
>>> html = urllib2.urlopen("http://craftstud.io/builds").read()
>>> re.search(r"Server \d+\.\d+\.\d+\.\d+", html).group()
'Server 0.1.24.1'

とは言うものの、pipを介してBeautifulSoup4をインストールできれば、将来的には多くの用途が見つかるでしょう。（数日前にWindowsマシンにコピーをインストールしたpip install BeautifulSoup4だけでなく、必ず使用してください。）pip install BeautifulSoup

python - シンプルで動的なWebスクレイピング-BeautifulSoupなし

1 に答える 1

Related

Reference