テーブル行を含む html ページを解析しようとしています。テーブル行内のすべてのテーブル セルを取得する必要があります。
解析しようとしている html のサンプルを次に示します。
<tr style="font-size:8pt;">
<TD style="font-size:8pt;">1545644656</TD>
<TD style="font-size:8pt;">Billy</TD>
<TD style="font-size:8pt;">Johnson</TD>
<TD style="font-size:8pt;">DEF</TD>
<TD style="font-size:8pt;"></TD>
<TD style="font-size:8pt;">1134 Main St</TD>
<TD style="font-size:8pt;"></TD>
<TD style="font-size:8pt;">AnyTown</TD>
<TD style="font-size:8pt;">PA</TD>
<TD style="font-size:8pt;">05405</TD>
</TR>
そして、ここに私が使用している正規表現があります tr start と tr end の間のすべてのものを取得します
Regex exp = new Regex("<tr style=\"font-size:8pt;\">(.*?)</TR>", RegexOptions.IgnoreCase | RegexOptions.Multiline);
次に、 foreach ループを実行して、すべての一致をループします (複数の行があります)
foreach (Match mtch in exp.Matches(browser.Html))
しかし、それは何も一致していません。新しい行 (\n) を追加する前に、サイトでまったく同じコードを使用していましたが、それはすべて 1 つの長い文字列でした...今では、彼らが使用している複数行のアプローチとは一致しません。
ここに何かアイデアはありますか?