HTMLドキュメントからテキストを取得するという簡単なタスクを実行しようとしています。そのためにHTMLdoc.DocumentNode.InnerTextを使用しています。問題は、一部のサイトでは、単語が異なるタグにある場合、単語の間にスペースを入れないことです。そのような場合、DocumentNode.InnerTextはそれらの単語を1つに接続し、役に立たなくなりました。
たとえば、私はその行を含むサイトを読み込もうとしています
<span>İstanbul</span><ul><li><a href="i1.htm">Adana</a></li>
意味のない「İstanbulAdana」を取得しています。
HTMLAgilityPackのドキュメントでもGoogleでも解決策が見つかりませんでした
私は何かが足りませんか?
ありがとう、