問題タブ [www-mechanize]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

369 問題

0 投票する

2 に答える

579 参照

perl - WWW::Selenium でファイルを保存する

perl の WWW::Selenium でファイルをダウンロードしようとしています。ファイルを保存/開くかどうかを尋ねるポップアップボックスが表示されます。それを操作して、特定の場所で「保存」と言いたいです。これがどのように行われるかわかりません。助けてください。

PS: このページでは WWW::Mechanize を使用できませんでした。Selenium を使用する必要があります。

どうもありがとう！

perl selenium www-mechanize

2010-07-12T17:09:10.220

0 投票する

2 に答える

3150 参照

perl - perl で印刷された「ワイド文字」を見つけるにはどうすればよいですか?

Web サイトから静的な html ページをスクレイピングして個々のファイルに書き込む perl スクリプトは機能しているように見えますが、多くのインスタンスwide character in print at ./script.pl line nをコンソールに出力します。スクレイピングされたページごとに 1 つです。

ただし、生成された html ファイルを少し見ただけでは、スクレイピングに明らかな間違いは見当たりません。問題のある文字を見つけて修正するにはどうすればよいですか? 私はそれを修正することさえ気にする必要がありますか？

関連するコード:

これは Perl 5.8.8 の OSX 上にあります。

perl unicode screen-scraping www-mechanize

2010-07-29T16:44:07.957

0 投票する

2 に答える

896 参照

perl - Perl で 50 万ページにアクセス

現在、Mechanize と get() メソッドを使用して各サイトを取得し、各メインページの content() メソッドで何かを確認しています。私は非常に高速なコンピューター + 10Mbit 接続を使用していますが、それでも 11K サイトをチェックするのに 9 時間かかりました。これは受け入れられません。問題は、明らかにページを取得する必要がある get() 関数の速度です。チェックする必要があるのはメインページのhtmlだけなので、何かを無効にするなど、高速化する方法はありますか。

ありがとう、

perl web-crawler www-mechanize

2010-09-10T06:58:51.880

0 投票する

2 に答える

2349 参照

perl - WWW::Mechanize が特定のページを GET するのはなぜですか?

Perl/HTML は初めてです。http://en.wikipedia.org/wiki/Periodic_table$mech->get($url)の周期表から何かを取得しようとしていますが、次のようなエラーメッセージを返し続けました:

エラー GET http://en.wikipedia.org/wiki/Periodic_table : PeriodicTable.pl 行 13 で禁止されています

ただし、http://search.cpan.org/$mech->get($url)の場合$urlは正常に動作します。

どんな助けでも大歓迎です！

これが私のコードです：

perl www-mechanize

2010-09-11T10:45:19.673

0 投票する

1 に答える

939 参照

html - HTML ページからすべてのリンクを抽出し、特定のテーブルからリンクを除外する

私はPerl/HTMLにかなり慣れていません。これが私がWWW::MechanizeとHTML::TreeBuilderでやろうとしていることです:

ウィキペディアの化学元素のページごとに、ウィキの他の化学元素のページを指すすべてのハイパーリンクを抽出し、それぞれの固有のペアを次の形式で出力する必要があります。

唯一の問題は、すべての化学元素のページ (ページの右上) にミニ周期表があることです。したがって、この小さな周期表では、すべての元素について同じ結果が得られます。そのテーブルを除いて、ページからすべてのリンクを抽出するのに問題があります。

[注:$elem == 6デバッグを容易にするために、(Carbon) (@line 42) のみを調べました。]

これが私のコードです：

html perl perl-module www-mechanize

2010-09-13T19:30:20.890

0 投票する

1 に答える

1363 参照

perl - WWW :: Mechanizeが正しいフォームを見つけられないのはなぜですか？

WWW :: Mechanizeを使用して、Webページからフォームを取得しています。

ウェブサイトのHTMLには次のようなコードがあります

しかし、私はエラーが発生します

私は何をしますか？

perl www-mechanize

2010-09-14T12:01:38.217

0 投票する

1 に答える

1324 参照

perl - PerlのWWW::MechanizeでWebプロキシを使用するにはどうすればよいですか？

プロキシサーバーでWWW::Mechanizeを使用しようとしていますが、動作させることができないようです。MechanizeはLWP::UserAgentのサブクラスであるため、リンクテキストを介したプロキシについて読んでいます。

プロキシのリストがあります。例：

使い方がわかりません。

ありがとう、

perl proxy www-mechanize

2010-09-15T08:18:17.690

0 投票する

1 に答える

286 参照

perl - PerlのWWW::Mechanizeを使用して、Webページが更新されているかどうかを確認するにはどうすればよいですか？

WWW::Mechanizeを使用してWebページを取得しています。ページが更新されているかどうかを確認し、そこから情報を取得する必要があります。これどうやってするの？

perl www-mechanize

2010-09-16T09:01:08.020

0 投票する

4 に答える

1794 参照

perl - Perl の WWW::Mechanize でタイムアウトから回復するにはどうすればよいですか?

WWW::Mechanize を使用して、数秒ごとに実行されるループで特定の Web ページを読み取ります。「GET」がタイムアウトし、スクリプトの実行が停止することがあります。ループを続行して次回「GET」を試行するように、そのようなタイムアウトから回復するにはどうすればよいですか?

perl www-mechanize

2010-09-22T05:07:41.130

0 投票する

1 に答える

1904 参照

perl - WWW :: Mechanizeを使用してラジオボックスをチェックするにはどうすればよいですか？

Webページに変更を加えながら、Webページの特定の部分をテストするためのPerlスクリプトを作成しています。WWW :: Mechanizeクラスを使用して、ラジオボックスを選択し、フォームを送信するにはどうすればよいですか？

perl radio-button www-mechanize

2010-09-23T20:08:47.740

1 2 3 4 5 6 7 8 9 10