-1

filehandle = urllib.urlopen(myurl)

後書きが必要なためregexfilehandleファイルハンドルをオブジェクトから文字列に変換する必要があります。Webページコードを文字列に保存するにはどうすればよいですか?

4

2 に答える 2

3

とても簡単です。

page = filehandle.read()

次のように、それを繰り返すこともできます。

lines = []
for line in filehandle:
    lines.append(line)

データを抽出するには、BeautifulSoupまたはlxmlを使用します。

于 2012-10-07T15:43:25.820 に答える
3

urllib.urlopenオブジェクトのようなファイルを返すため、それを呼び出すか.read()、直接反復することができます。

詳細については、ドキュメントを参照してください

編集:

何を説明してもいい

直接繰り返します

意味。

import urllib
request = urllib.urlopen("http://www.python.org")
for source_line in request:
    print source_line
于 2012-10-07T15:44:23.550 に答える