問題タブ [mechanize-ruby]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
386 参照

ruby-on-rails - フォーム内にテキストを取得するためのxpath

私はこのようなページのHTML構造を持っています、

xpathを使用して、「City:」、つまり「Carlyne、Saskatchewan、Canada」のテキストを抽出する必要があります。これを達成する方法についてのアイデアはありますか?

0 投票する
1 に答える
1004 参照

ruby - Rubyでmechanizeを使用してHeadリクエストを実行するにはどうすればよいですか?

HEADFaraday(Faraday.head url)でリクエストを実行できますが、現在のプロジェクトでMechanizeを使用しています。

ファイルをダウンロードせずにヘッダー(ファイル名)から値を取得したいのですが。Mechanize gemはそのようなオプションを提供しますか?私はv2.0を使用しています。

0 投票する
2 に答える
250 参照

ruby - Unexplained Inconsistency when Downloading an XLS file with Ruby Mechanize after redirect

I have a script that visits fcc.gov, then clicks a link which triggers a download:

This works fine when docket_number is "12-268". But when you change it to "96-128", Mechanize downloads the html of the page instead of the desired spreadsheet.

The urls for both pages are:

As you can see, if you visit each page in a browser (I'm using Chrome) and click "Export to Excel file", a spreadsheet file is downloaded and there is not problem. "96-128" has many more rows, so when you click on the Export link, it takes you to a new page that refreshes every 10 seconds or so until the file begins downloading. How can I get around this and why is there this inconsistency?

0 投票する
2 に答える
4692 参照

ruby - Nokogiri で解析された文字列から空白を削除できません

文字列から空白を削除できません。

私のHTMLは:

私のコードは次のとおりです。

gsubstripなどは機能しません。なぜ、どうすればこれを修正できますか?

Ruby 1.9.3 を使用しているので、Unicode は問題になりません。

0 投票する
1 に答える
848 参照

ruby - Ruby Mechanize: 「select」要素の値を検証する

ルビーの機械化を使用してドロップダウンの値を検証しようとしています

私はこのかなり印刷されたフォームを持っています:

前:

後:

私が実行しているコード:

... 3 番目のオプションに対応: 「テスト」

そして select HTML 要素:

選択ボックスからどのアイテムが選択されているかを確認しようとしています。

0 投票する
1 に答える
353 参照

ruby-on-rails - ウェブサイトからデータを抽出する

ウェブサイトから物件データを抽出したいのですが、

いくつかの Web サイトからデータを取得するために mechanize を使用しました。この Web サイトで mechanize を試してみましたが、最初のページの結果がすべて繰り返されました。

しかし、このウェブサイトでは、すべての結果呼び出しは ajax 呼び出しに基づいています。

ajax を使用しているこのタイプの Web サイトからデータを取得するにはどうすればよいですか。一部の ajax 呼び出し自体は暗号化されています。

前もって感謝します

0 投票する
4 に答える
751 参照

ruby - irbで複数のコマンドを実行する

Mechanizeを使用して、ログインが必要なサイトをクロールしています。次のコードでログインします。

私の質問は、Ruby IRBでこのコードを実行して、「エージェント」のように定義されたオブジェクトにアクセスして、必要な残りのコードを実験して生成できるようにするにはどうすればよいですか?

'load'を試しました。コマンドを実行しますが、「エージェント」などのオブジェクトは使用できません。

0 投票する
1 に答える
1030 参照

ruby - ruby mechanizeでページの説明を取得するには?

Mechanize でページの説明を取得するにはどうすればよいですか?

Pismo gemにはこの機能がありますが、Mechanize gemよりも劣っています。たとえば、Mechanize はイメージ タグを検索します。

Mechanize のドキュメントには、説明を取得する方法が見つかりませんでした。

より良いプラグインを知っている人はいますか、それを行う方法はありますか?

0 投票する
1 に答える
317 参照

ruby - とにかく検索して..の値を取得する方法はありますか?

Webページで、次の値があるとします。

test21Rubyを使用して値を見つける方法はありますか?

hrefまたは、サブストリングを持つ値を見つける方法はあります/testaa123/t.htmlか?

0 投票する
2 に答える
1692 参照

ruby - Mechanizeを使用して、拡張子が.docxおよび.xlsx、.txtのファイルをダウンロードできますか?

Mechanizeのドキュメントを閲覧しました。以下は.pdf専用です。

  1. しかし、.docx、.xlsx、.txtファイルもダウンロードできますか?
  2. ファイルのダウンロードが行われるとき、それはデフォルトのディレクトリは何でしょうか?保存ファイルディレクトリも変更できますか?
  3. ダウンロード中にどのブラウザを選択しますか?ブラウザコントロールを変更することもできますか?