問題タブ [mechanize-python]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - PythonでAjaxフォームに入力する
mechanizeモジュールを使用してajaxボックスのフォーム(これらのいくつかのフォームの私の用語)に入力しようとしていますが、機能しないようです。私はWebプログラマーではありませんが、ブラウザによって処理されるイベントでajaxボックスが「onchange」で更新されます。
Mechanizeはそれを処理していないようです。リンクリスト(イテレータBrowser.linksから)で、URL'javascript:AjaxRetry();'を見つけることができます。何かがうまくいかなかったことを私に告げるテキストとしてのエラーメッセージで。
これが私のコードです:
そのajaxボックスのフォームに入力するために適切なモジュールを機械化していますか?
そのボックスを表示するにはログインする必要があるため、そのajaxボックスがあるページへのリンクを貼り付けることができません。
python - Python Mechanize select form FormNotFoundError
mechanizeでフォームを選びたいです。これは私のコードです:
フォームのコード:
しかし、私はこのエラーを受け取ります:
python - Python Mechanize: セッションの有効期限が切れました
https asp サイトから一部のコンテンツをスクレイピングするために機械化しようとすると、200 が返されるため、ログイン ページの送信が機能しているように見えます。セッションの有効期限が切れたというエラーでログイン ページに戻りました。最後の印刷は、リダイレクトされたことを確認できるようにするためのものです。
python - Web Scraper: 単一ドメインでの 1 分/1 時間あたりのリクエスト数を制限しますか?
私は図書館員と協力して、彼の組織のデジタル写真アーカイブを再構築しています。
MechanizeとBeautifulSoupを使用して Python ロボットを構築し、コレクションから約 7000 の構造化が不十分で軽度の不正確/不完全なドキュメントを取得しました。データは、修正に使用できるスプレッドシート用にフォーマットされます。現在、検索ディクショナリを作成してデータを収集するために合計 7,500 件の HTTP リクエストが必要であると推測しています。ただし、コードの間違いややり直しはカウントされません。プロジェクトが進行するにつれて、さらに多くのリクエストが発生します。
これらのリクエストをどれだけ迅速に行うことができるかについては、ある種の組み込みの制限があると思います。たとえそれがなくても、負荷の高い Web サーバーで丁寧に振る舞うためにロボットに遅延を与えます。私の質問 (完全に正確に回答することは不可能であることは間違いありません) は、組み込みのレート制限に遭遇する前に HTTP リクエストをどれだけ迅速に行うことができるかということです。
スクレイピングしているドメインの URL を公開したくないのですが、関連性がある場合は、共有してもよいか友人に尋ねます。
注: これが私たちの問題 (データベースの再構築/整理) を解決するための最良の方法ではないことは理解していますが、データベースのコピーで私の友人を信頼するように上層部を説得するための概念実証を構築しています。から、彼は私がデータを直接操作できるようにするために必要な官僚機構をナビゲートします。
彼らは ATOM フィード用の API も提供してくれましたが、検索にはキーワードが必要で、特定のコレクション内のすべての写真をステップスルーするタスクには役に立たないようです。
python - ヘッダーのContent-Dispositionからファイル名を取得する方法
Mechanizeを含むファイルをダウンロードしていますが、応答ヘッダーに次の文字列があります。
そのファイル名の値を取得するための簡単な標準的な方法はありますか?私が今心に留めているのはこれです:
しかし、それは手っ取り早い「汚い」解決策のように見えます。
python - Pythonスクリプトでhttpリクエストがハングするのはなぜですか?
私のスクリプトの1つはXPシステムで完全に実行されますが、正確なスクリプトは2003システムでハングします。私は常にmechanizeを使用してhttpリクエストを送信します。例を次に示します。
コードに問題はないと思いますが、特定のURLへの特定のhttp POSTリクエストが発生するたびに、その2003コンピューターでハングします(そのURLでのみ)。このすべての理由は何であり、どのようにデバッグする必要がありますか?
ちなみに、スクリプトは数時間前までは問題なく実行されます。また、設定は変更されません。
python - Pythonmechanizeを使用したフォームの選択項目を含むItemNotFoundError
フォームは次のとおりです。
私のPythonコード:
エラーメッセージ:
私のスクリプトは「2.1.2」変数について知っていますが、「value2」ではなく「2.1.2」を使用して選択値を設定するにはどうすればよいですか?
python - PythonMechanizeがlogin.live.comフォームを見つけることができません
login.live.comにログインしようとしていますが、Mechanizeはそのページにフォームがあることを認識しません。誰か提案はありますか?
これにより、次のようになります。
mechanize._mechanize.FormNotFoundError:nr0に一致するフォームがありません
そのページに明確にフォームがある場合。
python - テキスト ファイルの特定の行を印刷できない
したがって、現在、次のような accounts.txt ファイルを読み取るためのこのコードがあります。
次に、これを (ここのメンバーのおかげで) accounts.txt ファイルを読み取り、ユーザー名とパスワードで分割して、後で印刷できるようにします。このコードでユーザー名とパスワードを分けて1行目を印刷しようとすると:
これは次のように出力されます。
(これらはテキストファイルにある3行で、適切に分割されていますが、すべての行と各行の最初の文字のみが印刷されています。)
私はいくつかの異なる方法を試しましたが、うまくいきませんでした。何をすべきか考えている人はいますか?
いつもお世話になっております。本当に感謝しています。これは私の 2 日目のプログラミングであり、このような単純な質問で申し訳ありません。
python - mechanize でフォームを送信する (TypeError: ListControl, must set a sequence)
mechanize でフォームを送信しようとしていますが、エラー (TypeError: ListControl, must set a sequence) が発生しました。すべてのフィールドを送信しようとしています。
mechanize 経由で取得したフォーム データ (for br.forms() print: f)
私の現在のコード
フォームオプションに正しい構文を使用していることを確認してください。ありがとう