Web ページから情報を取得するプロジェクトに取り組んでいます。HTMLソースには次のものがあります:
バスカの結果: Foram encontrados 264 casais
「encontrados」と「casais」の間の数字を取得する必要があります
とにかくPythonでそれを行うことはありますか? どの文字列関数を使用すればよいですか? この場合、正規表現の使用は避けたいと思います。
import urllib.request
f = urllib.request.urlopen("http://listadecasamento.fastshop.com.br/ListaCasamento/ListaCasamentoBusca.aspx?Data=2013-06-07")
s = f.read()
print(s.split())
これまでのところこれを入手しましたが、必要な数を見つけるのに苦労しています。
import urllib.request
f = urllib.request.urlopen("http://listadecasamento.fastshop.com.br/ListaCasamento/ListaCasamentoBusca.aspx?Data=2013-06-07")
s = f.read()
num = int(s[s.index("encontrados")+len("encontrados"):s.index("casais")])
これにより、以下のエラーが表示されます
TypeError: タイプ str はバッファ API をサポートしていません