正規表現を使用して、複数の DIV タグの間のテキストを取得できるようにしたいと考えています。たとえば、次のようになります。
<div>first html tag</div>
<div>another tag</div>
出力します:
first html tag
another tag
私が使用している正規表現パターンは、最後の div タグのみに一致し、最初の div タグを見逃しています。コード:
static void Main(string[] args)
{
string input = "<div>This is a test</div><div class=\"something\">This is ANOTHER test</div>";
string pattern = "(<div.*>)(.*)(<\\/div>)";
MatchCollection matches = Regex.Matches(input, pattern);
Console.WriteLine("Matches found: {0}", matches.Count);
if (matches.Count > 0)
foreach (Match m in matches)
Console.WriteLine("Inner DIV: {0}", m.Groups[2]);
Console.ReadLine();
}
出力:
見つかった一致: 1
内部 DIV: これは別のテストです