3

私がアクセスできるWeb サイトには、いくつかの入力フィールドがあります。6 番目のフィールドに、10000 個の文字列のリストから入力文字列を入力する必要があります。その後、行数を数えるだけでよい新しいページが表示されます。最後に、入力文字列と結果の行数のような 2 つの列を持つテーブルを取得したいと思います。すべての異なる 10000 文字列の情報を手動で入力する必要があるため、文字列を一般的な数式フィールドに入力して結果のテキストを取得するための最良の方法は何でしょうか。curl について聞いたことがありますが、これが最も簡単な方法かどうかはわかりません。

PSインタラクティブな方法の例:Google検索に文字列または単語を入力すると、検索結果の新しいページが表示されます。以前に Google のユーザー名とパスワードを導入したので、結果はおそらく私のプロファイルに従ってフィルタリングされます。

非対話的な方法の例: スクリプトは何らかの方法でユーザー情報、検索クエリを導入し、検索結果をテキスト ファイルに保存します。同じアイデアを想像してみてください

4

2 に答える 2

2

やりたいことは、特定のデータを含む HTTP POST を送信することです。これは、適切な HTTP クライアント コードで実行できます。その 1 つがlibcurl (またはpycurlバインディング、さらにはcurlコマンド ライン ツールの使用) です。投稿からの応答では、おそらくリダイレ​​クトを取得してから結果を取得するか、結果に対して別の要求を行う必要があり、完了して次の POST を実行するために戻ります。すべての POST が完了するまで繰り返します。

考慮する必要があるのは、Cookie を処理する必要があり、場合によっては POST からのリダイレクトに従う必要があることです。適切なアプローチは、ブラウザーで行ったように「手動セッション」を記録し (firebug や LiveHTTPHeaders などを使用)、その記録を使用して HTTP クライアントで同じことを繰り返すことです。

この種の作業の開始に関する詳細を取得するためのまともなチュートリアルがここにあります: http://curl.haxx.se/docs/httpscripting.html

于 2011-06-27T17:54:11.817 に答える
0

JMeterを使用してすべての投稿を実行することもできます。CSV 入力を使用して 10000 文字列を設定できます。次に、結果を xml として保存し、必要なデータを抽出します。

于 2011-07-01T17:24:22.113 に答える