階層データに一致する単一の正規表現を構築することは可能/実用的ですか?
例えば:
<h1>Action</h1>
<h2>Title1</h2><div>data1</div>
<h2>Title2</h2><div>data2</div>
<h1>Adventure</h1>
<h2>Title3</h2><div>data3</div>
試合で締めくくりたい。
"Action", "Title1", "data1"
"Action", "Title2", "data2"
"Adventure", "Title3", "data3"
私が見たように、これにはここで階層構造が作用していることを知る必要があり、H1 をキャプチャするパターンをコーディングすると、その階層の最初のエントリにのみ一致します。H1 をコーディングしないと、キャプチャできません。これを解決するために私が採用している特別なトリックがあるかどうか疑問に思っていました.
これは .NET プロジェクトです。