これまでのところ、AngleSharp ライブラリを使用して HTML を解析しようとしています。次の HTML を解析したいシナリオに出くわしました。
<a name="someLink" href="#someLink">Link 1</a>
Some text that happens to be in between elements...
<b>Some stuff in bold</b>
Some more text
<br>
もちろん、この HTML 部分には親要素などを囲んでいますが、この HTML 部分の解析済み要素のリストは次のようになります。
- Htmlアンカー要素
- HtmlBoldElement
- HtmlBreakRow要素
要素間のテキストを効果的にスキップします。このテキストを入手するにはどうすればよいですか? AngleSharp がこれらのパーツの TextNodes を生成すると思いますか?
親の完全な TextContent を取得することは、私がやりたいことではないことに注意してください。なぜなら、何が何であるかを知るために要素の構造が実際に必要だからです。