2

HTMLAgilityPackを使用してaspxページを解析するために、SOとGoogleの次のリンクと同様のリンクを調べました

HtmlAgilityPack を使用して HTML ドキュメントを解析する

しかし、aspx ページでボタンとラベルのコントロール名を識別できるように LINQ ステートメントを記述する方法がわかりません。

これが私のaspxページです。

<%@ Page Language="C#" AutoEventWireup="true" CodeBehind="WebForm4.aspx.cs" Inherits="WebApplication1.WebForm4" %>

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">

<html xmlns="http://www.w3.org/1999/xhtml">
<head runat="server">
    <title></title>
</head>
<body>
    <form id="form1" runat="server">
    <div>

            <asp:Button ID="Button1" runat="server" Text="Button on page4" />
        <br />
        <br />
        <asp:Label ID="Label1" runat="server" Text="Label on page 4"></asp:Label>
        <br />
                    <br />
        <asp:Button ID="Button2" runat="server" Text="second button page 4" />

                        <br />
        <asp:Button ID="Button3" runat="server" Text="second button page 4" />



    </div>
    </form>
</body>
</html>

次の出力を一覧表示できるように、HTML アジリティ パックを使用して LINQ を記述したいと考えています。

このページのコントロールは、Button1、Label1、Button2、Button3 です。

aspx ページを解析するための LINQ の記述に問題があります。助けてください。

これが私がこれまでに書いたものであり、機能していません。

   HtmlAgilityPack.HtmlDocument htmlDoc = new HtmlAgilityPack.HtmlDocument();

    htmlDoc.OptionFixNestedTags = true;

    string filePath = @"C:\WebApplication1\webform4.aspx";


    htmlDoc.Load(filePath);

        htmlDoc.Load(filePath);


        var pagecontrols = from links in htmlDoc.DocumentNode.Descendants("div")
                           where links.Attributes.Contains("runat")
                           select links.Attributes["ID"].Value;

        foreach (var pagecontrol in pagecontrols)
        {
            Response.Write(pagecontrol);
        }
4

2 に答える 2

2

問題を正しく理解している場合は、次のようなことを行う必要があります。

var pagecontrols = from links in htmlDoc.DocumentNode.Descendants("div")
                   where links.Attributes.Contains("runat")
                   select links.Attributes["ID"].Value;
于 2012-07-11T22:53:48.030 に答える
0

これに対する答えがすでに見つかっているかどうかはわかりませんが、これがうまくいった解決策です。

HtmlAgilityPack.HtmlDocument doc = new HtmlDocument();
HtmlNode.ElementsFlags.Remove("form");
doc.LoadHtml(aspPage);
var elements = doc.DocumentNode.Descendants("div");  
var pageControls = from z in elements.ChildNodes
                     where z.Attributes.Contains("runat") //server controls
                     select z.Attributes["ID"].Value;
于 2013-09-09T18:15:52.570 に答える