0

ユーザーログインなどを備えたWebベースのアプリケーションを開発し、このページでデータを取得する必要があるpythonアプリケーションを開発しました。

Python とシステムのデフォルト ブラウザを通信する方法はありますか? 私たちの主な目標は、システム ブラウザで Web ページを開き、そこから HTML ソース コードを取得することです。私たちはpython webbrowserで試してみて、ウェブページを開くことに成功しましたが、ソースコードを取得できず、urllib2で試してみました.その場合、システムのデフォルトブラウザのCookieなどを使用する必要があると思います.

4

3 に答える 3

1

https://pypi.python.org/pypi/selenium

Selenium の使用を試すことができます。これはテスト用に作成されたものですが、他の目的での使用を妨げるものは何もありません。

于 2013-03-05T14:49:41.460 に答える
0

Web サイトが Javascript なしでナビゲートできる場合は、Mechanizeまたはzope.testbrowserを試すことができます。これらのツールは よりも高レベルの API を提供し、urllib2ページ上のリンクをたどったり、HTML フォームに記入したりすることができます。

これは、たとえば、ログイン用の HTML フォームで Cookie ベースの認証を使用するサイトをナビゲートする際に役立ちます。

于 2013-03-05T14:52:56.117 に答える
0

モジュールを見てくださいnltk---ウェブページを見てテキストを取得するためのユーティリティがいくつかあります。BeautifulSoupもう少し精巧なもあります。私は現在、学習アルゴリズムのためにウェブページをスクレイピングするために両方を使用しています---これらはかなり広く使用されているモジュールであるため、ここで多くのヒントを見つけることができます:)

于 2013-03-05T15:23:14.410 に答える