私は、ウェブサイトからデータを抽出し、アクセスして保存する必要があるプロジェクトに取り組んでいます。Web サイトからデータを読み取って html doc に保存することはできますが、html doc を解析してアクセスに保存したいと考えています。以下は、html ファイルの内容です。
<HTML><HEAD><TITLE>NCEDC_Search_Results</TITLE></HEAD><BODY>Your search parameters are:
<ul>
<li>start_time=2002/01/01,00:00:00
<li>end_time=2037/01/01,00:00:00
<li>minimum_magnitude=3.0
<li>maximum_magnitude=10
<li>etype=E
<li>rflag=A,F,H,I
<li>system=selected
<li>format=ncread
</ul>
<PRE>
Date Time Lat Lon Depth Mag Magt Nst Gap Clo RMS SRC Event ID
----------------------------------------------------------------------------------------------
2002/01/10 00:44:51.53 40.4415 -126.0167 25.37 3.92 Md 56 269 147 0.29 NCSN 21208454
2002/01/12 04:41:46.93 36.7690 -121.4812 7.74 3.06 Md 54 35 5 0.09 NCSN 21208721
</PRE>
</BODY></HTML>
<pre></pre>
タグ間の中身が欲しい。列名は、上記の html ドキュメントに示されているとおりです。
C# で Html Agility Pack を使用してこれを達成するにはどうすればよいですか? このコードを試しましたが、さらに先に進むにはどうすればよいですか?
string txt=null;
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml("E://text.html");
HtmlNode node = doc.DocumentNode;
HtmlNodeCollection pre = node.SelectNodes("//pre");
//var prenodes = doc.DocumentNode.SelectNodes("//pre");
if (pre != null)
{
}
Console.ReadKey();
}