最近、ウェブページのスクレイピングを「楽しんで」います。操作したい Web サイトには API がないため、仕方がなく、この方法で行う必要があります。
私が抱えている問題の 1 つは、HTML ツリーの要素 (つまり、タグ、内部テキストなど) を読み取ることです。HttpWebRequest
およびを使用して、サーバーにGET/POSTリクエストを送信しますHttpWebResponse
。
webResponse
この方法でHTMLソースコードを読むことができます:
StreamReader sr = new StreamReader(webResponse.GetResponseStream(), Encoding.UTF8);
string sourceCode = sr.ReadToEnd();
私が必要とするのはvalue
、このinput
タグです:
<form action="/file.php" method="post">
<input name="abc" id="abc" type="hidden" value="some_random_value" />
</form>
どうやってやるの?