0

まず、Pythonと、mechanize、美しいスープ、urllib2などのいくつかのWebライブラリの経験があることを伝えたいと思います。

アイデアは、私が現在webbrowserで探しているWebページから情報を取得するアプリを作成することです。そしてそれを保存するよりも。

例:手動でWebサイトにアクセスし、ユーザーを作成します。私のアプリを実行するよりも、それは私が現在探しているウェブページからいくつかの詳細を取得します。ユーザー名、名、姓など。

問題:Webブラウザ上で実行するプログラムを作成する方法がわかりません。このWebページにログインして、残りの作業をBeautiful Soupで行うことはできません。これは、WebクローラーやWebボットからの保護が非常に優れているためです。

開始する場所が必要です。それで、主な質問は、現在私のWebブラウザにある情報を取得することは可能ですか?はいの場合、私のプログラムをブラウザで見せる方法についての提案を聞きたいですか?

私が何を求めているのか理解できない場合、またはいくつかの提案、私が使用できるいくつかのライブラリがある場合は、自由に記入してください。

4

1 に答える 1

0

最も簡単な方法は、現在のページのHTMLコンテンツをファイルに保存し([ファイル]-> [ページに名前を付けて保存]またはブラウザにあるものを使用)、そのファイルでBeautiful Soup /lxml.html/を実行することです。

私はこれを使ったことがなく、よくわかりませんが、おそらくSeleniumにあなたが望むことをさせることもできます。

于 2012-10-17T22:48:48.273 に答える