-1

ヘッダー セクション内のサイトのリストから h1 を取得し、それを Visual Basic/Studio のリスト ボックスに配置する方法を教えてください。

サイトの数はかなり多いので、マルチスレッドか何かが関係していると思います。

ウェブサイトの HTML ヘッダーの例:

<header> 
            <a href="http://www.example.org/"><h1>Exmaple header I NEED TO GET THIS</h1></a>
            <p>Example and more gibberish below</p>
            <div class="hero-unit">
                <button data-toggle="modal" data-target="#download" class="btn btn-large btn-download"><i class="icon-unlock icon-white"></i> Instant Download</button>
                <div id="download" class="modal hide fade" aria-hidden="true">
                    <div class="modal-header">
                        <button type="button" class="close" data-dismiss="modal" aria-hidden="true">×</button>
                        <h3>Blahblahblargh</h3>
                    </div>
                    <div class="modal-body" id="gw_content">
                        <img src="./landingpage/_img/wheel-throb.gif" />
                    </div>
                    <div class="modal-footer">
                        <p>Derp</p>
                    </div>
                </div>
                <p>meow</p>
            </div>

上記のコードから h1 を取得する必要があります。

これはやや複雑かもしれないので申し訳ありませんが、これを大幅に拡張する予定であり、これは私の自己学習経験に役立つと思います.

私は Visual Studio の基本を知っているので、フォームの作り方を教えてもらう必要はないと思います :)

編集:

ヘッダーの h1 タグのみが必要です。ありがとう!

4

1 に答える 1

1

HTML コードを解析するには、 HtmlAgilityPackを試す必要があります。NuGet Package ManagerAddInから簡単にインストールできます。

パッケージをインストールし、その機能の一部を調査したら、HAPTestbedなどのツールを使用して正規表現をテストすることをお勧めします。時間を大幅に節約できます。


出発点として使用できる基本的なサンプルを次に示します。

Dim wc As New WebClient()
Dim html = wc.DownloadString("http://some-web-site.com/")
wc.Dispose()
Dim htmlDoc As New HtmlDocument()
htmlDoc.LoadHtml(html)
For Each h1Node In htmlDoc.DocumentNode.SelectNodes("//h1")
    ' Do Something...
Next
于 2013-02-05T02:58:44.453 に答える