2

私は約 50 ページの html を持っており、それぞれに約 100 行以上のデータがあり、あらゆる種類の CSS スタイルがあり、html ファイルを読み込んで、名前、年齢、クラス、教師などのデータを取得したいと考えています。データベースに保存しますが、htmlタグを読み取ることができません

たとえば、ここに表示するために保持したスペース

<table class="table_100">
    <tr>
        <td class="col_1">
            <span class="txt_student">Gauri Singh</span><br>
            <span class="txt_bold">13</span><br>
            <span class="txt_bold">VIII</span><br>
        </td>
        <td class="col_2">
            <span class="txt_teacher">Praveen M</span><br>
            <span class="txt_bold">3494</span><br>
            <span class="txt_bold">3Star</span><br>
        </td>
        <td class="col_3">
        </td>
    </tr>
</table>
4

2 に答える 2

1

.NETの場合、HtmlAgilityPack
を試す ことができます。次の方法でHTMLページをXMLドキュメントに「変換」できます。

        HtmlDocument doc = new HtmlDocument();
        doc.Load(@"..\..\your_page.htm");
        doc.OptionOutputAsXml = true;
        doc.Save("your_page.xml");

そして、XMLドキュメントを解析するだけです。

于 2010-05-22T23:57:02.807 に答える
0

Html Agility Packを使用します。Html を解析したり、いじったりするための直感的で堅牢な .net API を提供します。

于 2010-05-22T23:23:30.720 に答える