ページを取得するために urllib ライブラリを使用しています。通常、私はトップレベルのドメイン名を持っており、そのドメイン内のすべてのページからいくつかの情報を抽出したいと考えています. したがって、xyz.com がある場合、コードで xyz.com/about などからデータを取得したいと思います。使用しているものは次のとおりです。
import urllib,re
htmlFile = urllib.urlopen("http://www.xyz.com/"+r"(.*)")
html = htmlFile.read()
...............
しかし、これは私にとってはうまくいきません。どんなアイデアでも大歓迎です。
ありがとう。-T