問題タブ [lwp-useragent]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
perl - PerlのLWP::UserAgentを使用して、異なるクエリ文字列で同じURLを取得するにはどうすればよいですか?
LWPの使用に関する記事を調べましたが、それでも迷っています。このサイトには多くの学校のリストがあります。概要ページを参照し、いくつかのリンクをたどって、いくつかの結果ページを取得します。
LWP :: UserAgentを使用してサイトを解析し、解析にはHTML :: TreeBuilder::XPathまたはHTML::TokeParserのいずれかを使用したい
現在、私は正しいget-requestを選択することを考えています!LWP::Useragentに問題があります。概要のサブサイトには、直接リンクからアクセスできます。ただし、注:各サイトにはコンテンツがあります。たとえば、上記の結果ページの次のURL。
ここの初心者として、完全なURLを投稿して、さまざまなエンディングのエンディングを表示することはできませんが、ここでエンディングを確認できます。
URLの末尾が異なる多くの異なるURLがあります。問題は、LWP::UserAgentを実行する方法です。フェッチして解析したい&**すべての-1000サイト**
質問; LWPは自動的に仕事をしますか!?または、LWP :: UserAgentを設定して、別のURLを自動的に検索するようにする必要がありますか...
解決策:おそらく、フォーム0から10000までカウントアップする必要があります
extern_eid = 709-(0から100000までカウント)ここ
www-db.sn.schule.de/index.php?id=21&extern_eid=709
ところで:ここにLWPユーザーエージェントのデータがあります。
リクエストメソッドこのセクションで説明するメソッドは、ユーザーエージェントを介してリクエストをディスパッチするために使用されます。次のリクエストメソッドが提供されています。
$ ua-> get($ url)$ ua-> get($ url、$ field_name => $ value、...)
このメソッドは、指定された$urlにGETリクエストをディスパッチします。リクエストのヘッダーを初期化するために、さらに引数を指定できます。これらは別々の名前/値のペアとして与えられます。戻り値は応答オブジェクトです。提供されるインターフェースの説明については、HTTP::Responseを参照してください。LWPがURLで指定されたサーバーに接続できない場合、またはプロトコルハンドラーで他の障害が発生した場合でも、応答オブジェクトが返されます。
問題は、上記のサイトでLWP :: UserAgentを正しい方法で使用する方法です-効果的に!?
私はすべての助けを楽しみにしています!
perl - Perl の LWP::UserAgent を使用して、同じ URL を異なるクエリ文字列で取得するにはどうすればよいですか?
次の URL に適用する必要がある実行中の LWP::UserAgent があります。
これは、多くの同様のターゲットで実行され、次のエンディングが表示されます。
LWP::UserAgent を使用してこれを行いたい:
いずれにせよ、そのような仕事にこのようなループを使用することは、それを行う方法です。LWP の API は、コア Perl の機能を置き換えることを目的としているわけではなく、Perl ループを使用して複数の URL を照会できると思います。
ループを適用する必要があるために実行されないコード:
10 月 25 日日曜日の更新: OmnipotentEntity からのアドバイスを適用しました。
結果をループしたいので、対応する URL を適用しようとしましたが、大量のエラーが発生しました。
今デバッグ部分。何を変更すればよいですか?URL を正しい方法で適用する方法は?
strict を使用する場合、宣言する前に変数を使用することはできません。通常の修正はmy
、たとえばmy $url
、my $pagecontent
最初に出現したときに を先頭に追加することです。
perl - Perlでループ-LWP::UserAgentを使用
ここでは、ループ内にビルドする必要があるコードを示します。これにより、USER-Agentが多数のターゲットを反復処理できるようになります。
これは反復する正しい方法ですか?私はあなたから話を聞くのが大好きです...出発点を得るために...
perl - Perlで10,000のブログフィードをチェックする効率的な方法
新しい投稿がないか1日に複数回チェックしたいブログが10,000件あります。Perlを使用してこれを行う最も効率的な方法に関するサンプルコードを含むいくつかのアイデアが欲しいです。
現在、LWP :: UserAgentを使用して各RSSフィードをダウンロードし、結果のフィード内の各URLを、すでに見つかったURLのMySQLデータベーステーブルに対して一度に1つずつチェックしています。言うまでもなく、これは拡張性が低く、非常に非効率的です。
よろしくお願いします!
perl - UserAgent Get Website on Loop に関する Perl の質問
最初の画像は問題なく取得できますが、コンテンツが内部でループしているようです。私が間違っているのかわかりません。
xml - PERLのLWP::UserAgentを使用したXML結果のダウンロード
Perlの問題についての支援を期待しています。
クエリの結果であるXMLファイルをダウンロードし、結果を解析し、XMLファイルから次のリンクを取得して、ダウンロードして繰り返す必要があります。
最初の結果セットを正常にダウンロードして解析することができました。
次のURLを取得しましたが、返される結果は変わらないようです。つまり、ループの2回目$res->content
は、1回目と同じです。したがって、の値は$url
最初のダウンロード後に変更されることはありません。
スコープの問題だと思いますが、うまくいかないようです。
perl - HTTP:Responseオブジェクトを解析します
Perlを介してフォームから結果を取得するのにいくつかの問題があります。フォームを見つけて適切なフィールドに必要な値を送信したと思いますが、応答オブジェクトを有用なものに変換する方法がわかりません(印刷すると次のように表示されます)。
HTTP::Request=HASH(0x895b8ac)
関連するコードは次のとおりです($ urlが正しいと仮定します)
$ roを便利にするために何ができますか?
ありがとう!
perl - LWP でプレーン文字列リクエストを送信する
特定の Web サイトから応答を取得するには、HTTP/1.1 という 1 つの正確な要求文字列を指定する必要があります。で試してみtelnet
ましたが、必要な応答が得られます(リダイレクトが必要ですが)。
しかし、同じ要求文字列を に渡そうとするとHTTP::Request->parse()
、メッセージが表示されるだけです400 URL must be absolute
。
私がLWP
言ったように、応答はtelnet
.
これはコードです:
誰でもここで私を助けることができますか?
perl - LWP :: UserAgentフォームパラメータを動的に構築する方法は?
HTTP POSTで使用するフォームパラメータのセットをその場で作成したいのですが、LWP::UserAgentが動的に使用するデータ構造にアクセス/作成する方法がわかりません。
典型的なサンプルコードでは、この構造がリクエストとして渡されます。
ハッシュに格納されているパラメータ名と値のセットがあり、ハッシュデータから角かっこで囲まれた構造を構築したいと思います。その構造は何ですか、そして私がやりたいことをどのように行うことができますか?(お分かりのように、私はPerlの専門家ではありません!)