2

Mechanize python ライブラリを使用して Web サイト内の特定のリンクをたどりたいのですが、興味のあるリンクは<div>タグ内のリンクだけです。この質問は関連していますが、彼らはlxml私が慣れていないパーサーを使用してそれを達成しています。私は BeautifulSoup を使用する方が快適です。

既に BeautifulSoup を使用して関連するリンクを見つけましたが、これらのリンクをたどるために Mechanize (またはその他のもの) を使用する方法がわかりません。文字列を Mechanize に渡してそれに従う方法はありますか?

4

2 に答える 2

1

単純なopen()もので十分です。

br.open('http://google.com')
于 2013-01-23T16:24:27.783 に答える
1
import mechanize
response = mechanize.urlopen("http://example.com/")
content = response.read() #The content is the code of the page (html)

または、ヘッダーなどを追加する場合:

import mechanize
request = mechanize.Request("http://example.com/")
response = mechanize.urlopen(request)
content = response.read() #The content is the code of the page (html)
于 2013-01-23T16:32:41.713 に答える