0

読むのをやめてHTMLの敏捷性(タイトルに基づく)を提案する前に、私はすでにこのツールを使用しています。問題はこれです:私はケース番号の全体の束をリストし、個々のケース番号ページへのリンクを持っているウェブページを持っています。私のアプリはすでにこの情報をダウンロードして、に表示していますdatagridview。ただし、私のアプリでは、個々のケース番号ページ(リンク)からの情報も必要です。

問題は、HTMLの敏捷性を使用して取得するには永遠にかかることをすでに知っていることです。ケースページを取得するには、約2分かかります。コードに関しては、HTMLの敏捷性にHTMLコードを供給し、セル値を配列に追加し、グリッドに表示する配列インデックスを解析します。これは、ページ上のコンポーネントの数を解析する非常に大きな配列です。

リンクされたページからメインページと特定のセルを取得するためのアイデアはありますか?

4

1 に答える 1

1

HmtlAgilityでXPathを使用する方法を示す例

HtmlDocument doc = new HtmlDocument(); doc.LoadHtml(yourHtml);

例1: //以下の例では、クラスをコンテナーforeachとして持つすべてのdivを取得します(doc.DocumentNode.SelectNodes( "// div [@ class ='container']")){
Console.Writeline(node.InnerText ); }

例2: //以下の例では、doc.DocumentNode.SelectNodes( "// div [@ class ='container'] [1]"))のコンテナHtmlNodeノードとしてクラスを持つ最初のdivを取得します。

Console.Writeline(node.InnerText);

Xpathクエリを使用して、必要な要素を取得できます

XPath構文などについては、リンクhttp://www.w3schools.com/xpath/xpath_syntax.aspを使用してください。

于 2012-07-19T07:49:09.627 に答える