2

ゲームが更新されるたびにサーバーソフトウェアをダウンロードするために使用できるURLを取得するために、動的なWebサイトをスクレイプしようとして忙しいです。

このサイトは「http://craftstud.io/builds」で、「ServerXX.XXX」と書かれているところが私がこすり取ろうとしているものです。

Javascriptや外部モジュールで複雑になりたくないので、簡単な解決策があれば私はすべての耳です。

また、BeautifulSoup(Stupid Windows)などのサードパーティ製モジュールをインストールすることもできません。

皆さんありがとう!

4

1 に答える 1

3

単純なものが必要な場合は、単純な正規表現の使用を検討してください。

>>> import re
>>> import urllib2
>>> html = urllib2.urlopen("http://craftstud.io/builds").read()
>>> re.search(r"Server \d+\.\d+\.\d+\.\d+", html).group()
'Server 0.1.24.1'

とは言うものの、pipを介してBeautifulSoup4をインストールできれば、将来的には多くの用途が見つかるでしょう。(数日前にWindowsマシンにコピーをインストールしたpip install BeautifulSoup4だけでなく、必ず使用してください。)pip install BeautifulSoup

于 2013-01-21T20:32:39.227 に答える