0

フォームがあるウェブサイトがあります。フォームに値を入力して結果を確認するプロセスを自動化したいと考えています。かなり多くのフォームの組み合わせをスキャンしたい (そのため、これを手動で行いたくない)。残念ながら、Cookie の使用量が多いため、cURL を使用して自動化できませんでした。

本当のブラウザを使って自動化できるのではないかと思いました。私はphantomjsとseleniumを考えていました(これまでseleniumを使用していませんでした)。Selenium は実際のブラウザを実行しますか? 実際のブラウザはすべての Cookie を処理するので、これは良いことです。

要するに、ウェブサイトのフォームに入力するために使用される Python 辞書がたくさんあります。フォームに入力した後、HTML をスキャンして結果を取得したいと考えています。その後、すべてを要約します (このステップは簡単です)。セレンは私のニーズに合っていますか? もっと良いものをお勧めできますか?

4

1 に答える 1

2

はい、セレンはブラウザエミュレータであり、実行すると実際のブラウザウィンドウが開きます

phantom-js は Selenium 用のヘッドレス Web キットであり、実際のブラウザー ウィンドウを表示せずにバックグラウンドでブラウザーを実行します。

urllib、リクエスト、または機械化を使用できない場合は、はい、最善の方法はセレンを使用することです

HTMLの解析には、本当に使いやすく、必要なすべての情報を取得できるBeautifulSoupをお勧めします

于 2013-10-13T22:45:33.440 に答える