私はこのhtmlを持っています。タグなしでInnerTextを取得しようとしていますが、
<h1>my h1 content</h1>
<div class="thisclass">
<p> some text</p>
<p> some text</p>
<div style="some_style">
some text
<script type="text/javascript">
<!-- some script -->
</script>
<script type='text/javascript' src='some_script.js'></script>
</div>
<p> some text<em>some text</em>some text.<em> <br /><br /></em><strong><em>some text</em></strong></p>
<p> </p>
</div>
やろうとしているのは、ユーザーがこのクラスのクラスからテキストを見るのと同じようにテキストを取得することです。スクリプトタグとすべてのタグを削除して、プレーンテキストを取得したいと思います。
これが使用しているものです:
Dim Tags As HtmlNodeCollection = root.SelectNodes("//div[@class='thisclass'] | //h1")
誰かアイデアはありますか?
ありがとう。