0

私が取り組んでいる個人的なプロジェクトでは、Web サイトからトラフィック データを取得したいと考えています。問題の Web サイトでは、これが表のセルに示されています。プログラムをサイトに接続し、ページを開いて、そのセルの内容を文字列として取得できますか? .NET フレームワークで主に C# を使用します。

4

3 に答える 3

2

これは、一般に「Web スクレイピング」と呼ばれる操作です。WebClient を使用して手動で行うことができます。

using System.Net;

using (WebClient client = new WebClient ()) 
{
    html = client.DownloadString(@"http://somesite.com/somepage.html");        
}

次に、文字列を解析して必要なデータを探します。これは、スクレイピングしているページの複雑さに応じて、簡単または非常に難しい場合があります。

より良い方法は、 HTML Agility Packのような Web スクレイピング ライブラリを使用することです。

于 2012-10-12T18:46:09.840 に答える
0

単純な GET であると仮定すると、System.Net.WebClient を DownloadString(...) に使用し、RegExpr を使用してセルのコンテンツを探します。

于 2012-10-12T18:40:33.800 に答える
0

WebFetchを見てください。

これは、HTTP コンテンツのフェッチに関する非常に優れたチュートリアルとサンプル コードです。

于 2012-10-12T18:44:16.173 に答える