今私は使用してHtmlAgilityPack
います。
しかし、Xpathで選択するのは非常に困難です。
Javaでは知っていJsoup
ます。同じことを行う.netライブラリはありますか?
Html を解析し、CSS スタイル セレクターを使用して要素を検索します。
HtmlAgilityPackで Fizzler を試してください。
フィズラーは:
CSS セレクターに基づいてノード ツリーから項目を選択する .NET ライブラリ。デフォルトの実装は HTMLAgilityPack に基づいており、HTML ドキュメントから選択します。
プロジェクト Web サイトの例:
// Load the document using HTMLAgilityPack as normal
var html = new HtmlDocument();
html.LoadHtml(@"
<html>
<head></head>
<body>
<div>
<p class='content'>Fizzler</p>
<p>CSS Selector Engine</p></div>
</body>
</html>");
// Fizzler for HtmlAgilityPack is implemented as the
// QuerySelectorAll extension method on HtmlNode
var document = htmlDocument.DocumentNode;
// yields: [<p class="content">Fizzler</p>]
document.QuerySelectorAll(".content");
// yields: [<p class="content">Fizzler</p>,<p>CSS Selector Engine</p>]
document.QuerySelectorAll("p");
// yields empty sequence
document.QuerySelectorAll("body>p");
// yields [<p class="content">Fizzler</p>,<p>CSS Selector Engine</p>]
document.QuerySelectorAll("body p");
// yields [<p class="content">Fizzler</p>]
document.QuerySelectorAll("p:first-child");
私には非常に有望に見えるこのライブラリを試すことができます。私は自分で試したわけではないので、そのライブラリを試してみたら、あなたの経験を私たちと共有したいと思うかもしれません.
ライブラリ: CsQuery ウェブサイト: https://github.com/jamietre/CsQuery サンプル:
// get all elements that are first children within 'body' (e.g. excluding 'head')
var childSpans = dom["body"].Find(":first-child");