0

テーブル行を含む html ページを解析しようとしています。テーブル行内のすべてのテーブル セルを取得する必要があります。

解析しようとしている html のサンプルを次に示します。

<tr style="font-size:8pt;">
    <TD style="font-size:8pt;">1545644656</TD>
    <TD style="font-size:8pt;">Billy</TD>
    <TD style="font-size:8pt;">Johnson</TD>
    <TD style="font-size:8pt;">DEF</TD>

        <TD style="font-size:8pt;"></TD>
        <TD style="font-size:8pt;">1134 Main St</TD>
        <TD style="font-size:8pt;"></TD>
        <TD style="font-size:8pt;">AnyTown</TD>
        <TD style="font-size:8pt;">PA</TD>
        <TD style="font-size:8pt;">05405</TD>

</TR>

そして、ここに私が使用している正規表現があります tr start と tr end の間のすべてのものを取得します

Regex exp = new Regex("<tr style=\"font-size:8pt;\">(.*?)</TR>", RegexOptions.IgnoreCase | RegexOptions.Multiline);

次に、 foreach ループを実行して、すべての一致をループします (複数の行があります)

foreach (Match mtch in exp.Matches(browser.Html))

しかし、それは何も一致していません。新しい行 (\n) を追加する前に、サイトでまったく同じコードを使用していましたが、それはすべて 1 つの長い文字列でした...今では、彼らが使用している複数行のアプローチとは一致しません。

ここに何かアイデアはありますか?

4

2 に答える 2