“mechanize-python”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

833 参照

python - PythonでAjaxフォームに入力する

mechanizeモジュールを使用してajaxボックスのフォーム（これらのいくつかのフォームの私の用語）に入力しようとしていますが、機能しないようです。私はWebプログラマーではありませんが、ブラウザによって処理されるイベントでajaxボックスが「onchange」で更新されます。

Mechanizeはそれを処理していないようです。リンクリスト（イテレータBrowser.linksから）で、URL'javascript：AjaxRetry（）;'を見つけることができます。何かがうまくいかなかったことを私に告げるテキストとしてのエラーメッセージで。

これが私のコードです：

そのajaxボックスのフォームに入力するために適切なモジュールを機械化していますか？

そのボックスを表示するにはログインする必要があるため、そのajaxボックスがあるページへのリンクを貼り付けることができません。

2011-08-03T16:16:33.927

0 投票する

2 に答える

7552 参照

python - Python Mechanize select form FormNotFoundError

mechanizeでフォームを選びたいです。これは私のコードです：

フォームのコード：

しかし、私はこのエラーを受け取ります：

python mechanize mechanize-python

2011-10-06T11:54:53.533

0 投票する

1 に答える

665 参照

python - Python Mechanize: セッションの有効期限が切れました

https asp サイトから一部のコンテンツをスクレイピングするために機械化しようとすると、200 が返されるため、ログインページの送信が機能しているように見えます。セッションの有効期限が切れたというエラーでログインページに戻りました。最後の印刷は、リダイレクトされたことを確認できるようにするためのものです。

python mechanize mechanize-python

2011-10-11T02:33:38.010

0 投票する

1 に答える

2553 参照

python - Web Scraper: 単一ドメインでの 1 分/1 時間あたりのリクエスト数を制限しますか?

私は図書館員と協力して、彼の組織のデジタル写真アーカイブを再構築しています。

MechanizeとBeautifulSoupを使用して Python ロボットを構築し、コレクションから約 7000 の構造化が不十分で軽度の不正確/不完全なドキュメントを取得しました。データは、修正に使用できるスプレッドシート用にフォーマットされます。現在、検索ディクショナリを作成してデータを収集するために合計 7,500 件の HTTP リクエストが必要であると推測しています。ただし、コードの間違いややり直しはカウントされません。プロジェクトが進行するにつれて、さらに多くのリクエストが発生します。

これらのリクエストをどれだけ迅速に行うことができるかについては、ある種の組み込みの制限があると思います。たとえそれがなくても、負荷の高い Web サーバーで丁寧に振る舞うためにロボットに遅延を与えます。私の質問 (完全に正確に回答することは不可能であることは間違いありません) は、組み込みのレート制限に遭遇する前に HTTP リクエストをどれだけ迅速に行うことができるかということです。

スクレイピングしているドメインの URL を公開したくないのですが、関連性がある場合は、共有してもよいか友人に尋ねます。

注: これが私たちの問題 (データベースの再構築/整理) を解決するための最良の方法ではないことは理解していますが、データベースのコピーで私の友人を信頼するように上層部を説得するための概念実証を構築しています。から、彼は私がデータを直接操作できるようにするために必要な官僚機構をナビゲートします。

彼らは ATOM フィード用の API も提供してくれましたが、検索にはキーワードが必要で、特定のコレクション内のすべての写真をステップスルーするタスクには役に立たないようです。

python http mechanize mechanize-python

2011-10-14T21:07:23.440

0 投票する

3 に答える

21446 参照