2

Webページのhtmlテーブルを変数にスクレイピングする関数を構築するための最良のアプローチは何ですか.

いくつかの一意の識別子 (テーブル ID など) を渡すことができるようにしたいのですが、すべてのデータが DataTable のようなものに返されます。

4

2 に答える 2

7

HtmlAgilityPackを使用して HTML を解析し、テーブル データを抽出できます。

HAPがLinqをサポートするようになったので、次のようなものから始めることができます:

HtmlDocument doc = ...
var myTable = doc.DocumentNode
                 .Descendants("table")
                 .Where(t =>t.Attributes["id"].Value == someTableId)
                 .FirstOrDefault();

if(myTable != null)
{
    ///further parsing here
}
于 2011-11-15T21:57:00.353 に答える