問題タブ [mechanize]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
2770 参照

python - Python 機械化はボタンをクリックしません

次のスクリプトを確認してください。

つまり、送信ボタンの name=value ペア (register=Register) は追加されません。なぜこうなった?ClientForm は他のページでは正しく機能していますが、このページでは機能していません。サブミット コントロールの disabled および readonly 属性を True に設定しようとしましたが、問題は解決しませんでした。

0 投票する
1 に答える
2241 参照

python - Python ClientFormに存在しないフィールドを設定するにはどうすればよいですか?

Pythonの一部のWebクロールにmechanize(clientformを使用)を使用していますが、JSをサポートしていないため、フォームに存在しない入力の値を設定します(入力はJSによって生成されます)。これどうやってするの?

エラーは、実行しようとした場合に発生するエラーと似ています

0 投票する
1 に答える
782 参照

ruby - Ruby - ディスクに保存せずに Mechanize::File レスポンスを操作する

私は最初の ORM プロジェクトに取り組んでおり、Mechanize を使用しています。状況は次のとおりです。

Web サイトから Mechanize::File オブジェクトに zip ファイルをダウンロードしています。zip の中には、3 つのフォルダーの深さ (folder_1/folder_2/file.txt) に埋め込まれたファイルがあります。file.txt を zip ファイルから取り出して、zip ファイル自体の代わりに返したいと思います。

私が最初に考えたのは、zip/zipfilesystem を使用することでした。最初にファイルをディスクに保存して Zip::ZipFile.open(src) を使用すると、これをうまく行うことができますが、Mechanize::File.body から直接ファイルを送信する方法/可能性があるかどうかを誰か教えてください。

私の腸は、これは可能でなければならないと言っていますが、基本的なものが欠けているだけです。私は試した...

...しかし、私が知る限り、Zip::ZipFile はファイルシステムからソースを見つけるように設定されているだけです。

ご不明な点がございましたら、お気軽にお問い合わせください。

前もってありがとう ロブ

0 投票する
5 に答える
1958 参照

python - Web サイトをスクレイピングするには、どのピュア Python ライブラリを使用すればよいですか?

現在、いくつかの Web サイトをスクレイピングするために使用される Ruby コードがいくつかあります。私がRubyを使っていたのは、当時あるサイトでRuby on Railsを使っていたからで、それが理にかなっているのです。

今、私はこれを Google App Engine に移植しようとしていますが、行き詰まり続けています。

Google App Engine で動作するように Python Mechanize を移植しましたが、XPATH を使用した DOM インスペクションをサポートしていません。

組み込みの ElementTree を試してみましたが、'&mdash' に遭遇したときに最初に指定した HTML BLOB で停止しました。

そこで ElementTree をハッキングしようとしますか、それとも何か他のものを使用しようとしますか?

ありがとう、マーク

0 投票する
3 に答える
3803 参照

python - follow_link()とback()の機械化に関する問題

次のリンクを機械化する際に問題が発生しました。これが私が目指していることの抜粋です:

機械化の例によると、これは問題なく機能するはずです。しかし、そうではありません。.back()を呼び出しても、アクセスするリンクがさらにある場合でも、ループは終了します。mech.follow_link(link)とmech.back()をコメントアウトして、print link.textに置き換えると、50個ほどのリンクがすべて出力されます。ただし...mech.follow_linkのコメントを解除するとすぐに、最初のfollow_linkの直後にループが終了します。back()は機能しており、mech.title()を印刷してから、mech.back()を呼び出してmech.title()をもう一度印刷すると、最初のタイトル、次に「戻る」ページのタイトルが明確に表示されます。私は本当に混乱しています、そしてこれはそれがドキュメントで行われている方法です。何が起こっているのかわからない。

0 投票する
2 に答える
3547 参照

ruby - Ruby のこぎり解析 HTML テーブル

mechanize/nokogiri を使用しており、次の HTML 文字列を解析する必要があります。これを行うための xpath 構文または他の機能する方法を手伝ってくれる人はいますか?

これを出力として欲しい

0 投票する
1 に答える
2133 参照

python - mechanize は python にログインできません

mechanize pythonを使用して自動ログインスクリプトを作成しています。

機械化する前は問題なかったのですがwww.gmarket.co.kr、このサイトではできませんでした。

ログインしようとするたびに、正しい gmarket id を使用しても常にログイン ページが返され、pass、ログインできず、疑わしいメッセージが表示されました

これは私の問題に関連していると思いますが、正確な処理方法がわかりません。ログイン テスト用の ID とパスの例を次に示します。

id: tgi177 パス: tk1047

誰かが私を助けてくれるなら、事前に感謝します

コード:

0 投票する
3 に答える
3339 参照

python - より堅牢な HTML パーサーを Python の機械化に接続することは可能ですか?

mechanize を使用して Web サイトのフォームを解析して送信しようとしていますが、組み込みのフォーム パーサーがフォームとその要素を検出できないようです。不適切な形式の HTML で窒息していると思われます。不適切な HTML (lxml や BeautifulSoup など) を処理するように設計されたパーサーで事前解析してから、きれいに整形されたクリーンアップされた出力をフォームに送りたいと思います。パーサー。フォームを送信するためだけでなく、セッションを維持するためにも機械化する必要があります (ログインセッション内からこのフォームを操作しています)。

実際に可能である場合、これを行う方法がわかりません..HTTPプロトコルのさまざまな詳細、さまざまな部分を連携させる方法などに精通していません.何かポインタはありますか?

0 投票する
1 に答える
24977 参照

python - ボタンをクリックしてpythonを機械化する

ボタン付きのフォームがあり、<input type="button" name="submit" />クリックできるようにしたいと考えています。

試してみmech.form.click("submit")ましたが、次のエラーが発生します。

ControlNotFoundError: no control matching kind 'clickable', id 'submit'

mech.submit()タイプがボタンで送信されないため、機能しません。

何か案は?ありがとう。

0 投票する
1 に答える
3892 参照

python - TypeError: ListControl、シーケンスを設定する必要があります (python エラー)

Python Mechanize を使用して Web サイトを開き、フォームに入力して、そのフォームを送信しています。それは実際には非常に簡単です。ラジオボタンに出くわし、入力ボックスを「選択」するまで機能します。

このエラーが発生するのはなぜですか? テキスト ボックスのようにEを設定できないのはなぜですか? (Eはラジオボタン)

編集: Web Developer によると、これはフォームです。