プログラムで Web ページにアクセスし、そこから情報を抽出したいと考えています。
コードを使用して Web サイトにログインしJava
、実際のブラウザーからの要求であるとサーバーに感じさせたいと考えています。
1つの問題がありますが、私はほとんどそこにいます.Webサイトでは、parameter - "sessid"
リクエストごとに変化し続けるすべてのリクエストで渡す必要があります。
たとえば、最初にページにアクセスしたときsessid=90334
、次のページでは のようになりsessid=78204
ます。
したがって、url
I パスには の値が含まれている必要があります。sessid
それ以外の場合、認証は失敗します: www.somesite.com/somepage.php?sessid=75749
。
Web ページには の値を保持する 1 つの<input>
タグが含まれsessid
ており、そのタグの値を取得する必要があります。
どうやってやるの?タグは次のようになります。
<input type="hidden" name="sessid" value="69529">
次のコードを使用して、Web ページ全体を正常に読み取ることができます。
BufferedReader rd = new BufferedReader(new InputStreamReader(conn.getInputStream()));
StringBuilder response = new StringBuilder();
String line;
while ((line = rd.readLine()) != null) {
response.append(line);
}