1

Web サイトから成績を取得するための Web スクレイピング プログラムを作成しています。Mechanize を使用してページにログインし、スクレイピングしている領域に移動しました。残念ながら、このページは Javascript を使用してページを暗号化しています (おそらく、私のスクレイピングを止めるためです)。復号化スクリプトを見つけ、Python に移植しました。それは機能し、ページから暗号化された文字列を抽出するために使用しました。変換すると、HTML のテーブルになります。

要するに、HTML をページに挿入し、mechanize を使用して表のリンクを使用して成績を取得する方法はありますか?

助けてくれてありがとう!

編集:それが助けになるなら、私も美しいスープを持っています.

4

1 に答える 1

0

私はこれを使用するだけになりました:

response = br.open("www.linknotonpagethatiwanttogoto.com")
page = response.read()

.follow_link() を使用する代わりに、リンクの .open() を応答として保存することがわかりました。また、ブラウザーは同じ Cookie を使用するため、セッション Cookie は保持されます。そのため、html を解析した後、リンクを .open() にポップし、新しいページを取得しました。

于 2013-03-20T13:21:04.440 に答える