2

だから私はログインシステムの背後にある何かをこすり取ろうとしています。CasperJSを使用してみましたが、フォームに問題があるため、それが方法ではない可能性があります。サイトのソースコードを確認したところ、フォーム名は「theform」ですが、ログインできないので、何かおかしなことをしているに違いありません。CasperJSを使用してこれを正しく行う方法についてのチュートリアルはありますか?APIとgoogleを調べましたが、実際には何も機能しません。

または、誰かがWebスクレイピングを簡単に行う方法について何かアドバイスがありますか。単純な条件付き状態を確認して、いくつかのボタンをクリックする必要があります。それだけです。

4

5 に答える 5

4

残念ながら、CasperJS の作成者である私は、実際のコードや再現可能なテスト ケースを見なければ、あまり役に立ちません。

あなたの投稿はタグ付けされているので、 Ghost.pyPythonに興味があるかもしれません。これは、CasperJSに触発されたプロジェクトですが、Python API を備えています。

于 2012-11-18T20:27:44.097 に答える
1

mechanize(PythonでのステートフルプログラマティックWebブラウジング)でログインできます !

解析ページには、 BeautifulSoupから使用できます!

于 2012-11-17T23:19:31.333 に答える
1

あなたの質問では CasperJS に言及していますが、質問に python のタグを付けています。Python を言語として使用する場合は、Web スクレイピング用のさまざまなツールについて説明しているビデオを確認できます。

ログインを使用して Web ページを管理するには、上記の Web サイドのサンプル コードを mechanize使用できます 。

br = mechanize.Browser()
# Explicitly configure proxies (Browser will attempt to set good defaults).
# Note the userinfo ("joe:password@") and port number (":3128") are optional.
br.set_proxies({"http": "joe:password@myproxy.example.com:3128",
"ftp": "proxy.example.com",
            })
# Add HTTP Basic/Digest auth username and password for HTTP proxy access.
# (equivalent to using "joe:password@..." form above)
br.add_proxy_password("joe", "password")
# Add HTTP Basic/Digest auth username and password for website access.
br.add_password("http://example.com/protected/", "joe", "password")

他の良いpythonの選択はスクレイピーです

于 2012-11-17T21:16:27.197 に答える
0

スクラップ データだけが必要な場合は、もっと簡単なことを試してみませんか? スクラップしようとしているサイトに派手な JavaScript がない場合、mechanize はそのような目的に適しています

ここに良い議論のトレッドがあります: Python はウェブサイトへのログインを機械化します

于 2012-11-17T21:08:56.747 に答える
0

CasperJS とおっしゃっていたので、Web サイトは JavaScript を使用して何らかのデータを生成していると推測できます。私の提案は WebKit をチェックすることです。これはブラウザの「エンジン」であり、ウェブサイトでやりたいことが何でもできるようになります。非常に優れた PyQt4 フレームワークを使用でき、優れたドキュメントがあります。

于 2012-11-18T03:06:10.410 に答える