私はいくつかのhtmlをテキストとリンクと混合していて、リンクを削除せずにリンクされた単語でテキストをそのまま抽出し、後で同じ場所に戻すためにいくつかのクレイジーなことをしたいと思います。
HTMLは次のようになります。
<div id="i want what is inside here">
<h3>some text</h3>
<div>more text with a <a href="url">link</a></div>
<p>some more text<br />
<a href="url">another link</a> here...</p>
</div>
そして、私が欲しかった出力は次のとおりです。
some text
more text with a <a href="url">link</a>
some more text
<a href="url">another link</a> here...
最近、HTMLAgilityPackを使用してテキストを抽出する方法を知っています。先祖の使用方法について多くの新しいことを学び、xpathやその他のことを先取りして、不思議に思いました。
xpathを使用して上記の目的の出力を取得することは可能ですか、それともどのようにすればよいですか?
これに使用できるxpath条件がない場合は、テキストを抽出してからリンクを抽出し、テキスト内のリンクの内部テキストの一致をリンクに置き換えることを考えていました(信頼性は低いと思います)が、それは可能性があると考えた1つの方法でしたやった、あなたは私に何をするようにアドバイスしますか?