問題タブ [mechanize]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
ruby - ruby mechanize:ダウンロードしたバイナリcsvファイルの読み方
私は、バイナリ データで ruby を使用することにあまり慣れていません。mechanize を使用して多数の csv ファイルをローカル ディスクにダウンロードしています。次に、これらのファイルで特定の文字列を検索する必要があります。
mechanize で save_as メソッドを使用してファイルを保存します (ファイルをバイナリとして保存します)。ファイルのコンテンツ タイプ (mechanize による) は次のとおりです。
ここから、ファイルの読み方がわかりません。Rubyで通常のファイルとして読み込もうとしましたが、バイナリデータしか取得できません。また、標準の UNIX ツール (strings/grep) を使用して検索を試みましたが、うまくいきませんでした。
ファイルの 1 つで「file」コマンドを実行すると、次のようになります。
catまたはviでデータを問題なく見ることができます。vi では、いくつかの制御文字も表示されます。
また、csv と fastcsv の両方の Ruby ライブラリを試しましたが、これらに対して「IllegalFormatError」例外が発生します。私も運なしでこの解決策を試しました。
どんな助けでも大歓迎です。ありがとう。
c# - C# での WebBrowsing - ライブラリ、ツールなど - Perl の Mechanize のようなものはありますか?
Mechanize for .NET に似たものを探しています...
Mechanize が何かわからない場合は.. http://search.cpan.org/dist/WWW-Mechanize/
ここに提案のリストを維持します。ブラウジング/投稿/スクリーン スクレイピングに関するもの (WebRequest および WebBrowser コントロール以外)。
解析中
- HTMLAgilityPack - http://www.codeplex.com/htmlagilitypack
ウェブアプリのテスト
WatiN - Web アプリケーション テスト フレームワーク (.NET) - http://watin.sourceforge.net/
セレン - http://seleniumhq.org/
Art of Test Design Canvas - コストがかかる
ツール
- Firefox の Firebug
- IE 用 Internet Explorer 開発者ツールバー
- クロムにもあります
ノート
WatiN は私が探しているものに近いですが、ブラウザーを開く点が異なります。これは煩わしいと同時に素晴らしいものです。何をしているかによります。
ruby - mechanize (ruby) を使用して vBulletin 3.6 にログインする方法
HTML は以下のようになります。または、ここで見つけることができますhttp://www.vbulletin.org/forum/index.php
以下の私のコードは機能しません。いくつかの非表示フィールドを送信する必要があるように思えます。誰か知っていますか
- 非表示のフィールドを送信するには?
- 名前と値、またはそれらの1つだけを送信する必要がある場合は?
- vBulleting v3.6 へのログイン方法
テキストの下にコードとして表示するテキスト
ruby - mechanize を使用する ruby アプリケーションをテストする方法
Mechanize を使用してサイトを走査する小さなプログラムを作成しました。
テストを書きたいのですが、テストを実行するたびに実際にサイトにログオンしたくありません。インターネットをモックして、あるサイトにアクセスしたときに、保存された結果を返すだけにしたいと思います。
ここに小さな例があります。私のコードの目的は、Google ホームページからリンクを引き出すことだったので、コードが見つけた最初のリンクに「画像」というテキストが含まれていることを確認するテストを作成します。私は次のように書くかもしれません:
実際にインターネットにアクセスするオーバーヘッドなしで my_code_to_find_links をテストできるように、google.com をモックするにはどうすればよいですか?
ありがとう -ジョシュ
python - b.form.submit() を呼び出した後、mechanize.Browser のインスタンスを同じページにとどめることはできますか?
Python の mechanize.Browser モジュールでは、フォームを送信すると、ブラウザ インスタンスがそのページに移動します。この 1 つの要求については、私はそれを望んでいません。現在のページにとどまり、別のオブジェクトで応答を返したいだけです(ループの目的で)。誰でも簡単にこれを行うことができますか?
編集: うーん、urllib2 リクエストを返す ClientForm.HTMLForm.click() でこのような作業をしていますが、mechanize の cookiejar からの Cookie を urllib2.urlopen リクエストで使用する必要があります。Cookie がインポートされることを除いて、urllib2 と同じようにリクエストを送信できる mechanize のメソッドはありますか?
python - mechanize を使用したカスタム認証ハンドラー
mechanize.Browser() でpython-ntlmを使用したいurllib2 と mechanize.urlopen() で動作する HTTPNtlmAuthHandler を取得し、Browser() で使用しようとしましたが、動作しません
これがurlopenに使用しているコードです
要求に応じてトレースバック
ruby - 機械化とリダイレクト (ruby)
デフォルトでは、機械化はリダイレクトに従うと思いました...私のスクリプトでは、リダイレクトページで終了します。どうすればこれを処理できますか?
リダイレクトページのhtml
python - getControlを使用して、名前変数以外のオブジェクトを制御します
前回の質問で推奨されているZopeテストブラウザを使用しています。私が直面している問題は、getControl関数を使用して、パスワード、ユーザー名などのさまざまなオブジェクトを制御できることです。
次のページに移動するためにページを送信しようとしていますが、送信ボタンには「name」変数がなく、「id」変数のみがあります。「送信」は次のように記述されます。
その他のオブジェクトは次のように記述されます。
これを変更するためのアクセス権がありません。'password'オブジェクトの制御を取得するために使用しているpythonzopeコードは次のとおりです。
送信ボタンには「名前」がないので、次のように書きました。
これにより、「id」が無効であるというエラーが出力されます。
'submit'の他の値の1つを制御する方法はありますか?
助けてくれてありがとう。
python - easy_install による機械化のインストール
easy_install をダウンロードしましたが、mechanize のインストールに問題があります。サイト パッケージに対処する必要があります。以下の最初の試行で、エラーが発生しました。以下の 2 回目の試行では、ダウンロードしたことが確実にわかっているので、奇妙なコマンドが見つかりませんでした。
ruby - 文字列「post」を使用してフォームを識別できませんでしたが、「POST」です。html に「投稿」が含まれています
動作しなかったコード:
login_form = page.form_with(:method => 'post')
動作するコード:
login_form = page.form_with(:method => 'POST')
フォームオブジェクトを調べてputs page.forms.inspect
取得しました
html ソース:
これはバグですか、それとも意図した動作ですか?