Webページのhtmlテーブルを変数にスクレイピングする関数を構築するための最良のアプローチは何ですか.
いくつかの一意の識別子 (テーブル ID など) を渡すことができるようにしたいのですが、すべてのデータが DataTable のようなものに返されます。
HtmlAgilityPackを使用して HTML を解析し、テーブル データを抽出できます。
HAPがLinqをサポートするようになったので、次のようなものから始めることができます:
HtmlDocument doc = ...
var myTable = doc.DocumentNode
.Descendants("table")
.Where(t =>t.Attributes["id"].Value == someTableId)
.FirstOrDefault();
if(myTable != null)
{
///further parsing here
}