私が取り組んでいる個人的なプロジェクトでは、Web サイトからトラフィック データを取得したいと考えています。問題の Web サイトでは、これが表のセルに示されています。プログラムをサイトに接続し、ページを開いて、そのセルの内容を文字列として取得できますか? .NET フレームワークで主に C# を使用します。
質問する
1186 次
3 に答える
2
これは、一般に「Web スクレイピング」と呼ばれる操作です。WebClient を使用して手動で行うことができます。
using System.Net;
using (WebClient client = new WebClient ())
{
html = client.DownloadString(@"http://somesite.com/somepage.html");
}
次に、文字列を解析して必要なデータを探します。これは、スクレイピングしているページの複雑さに応じて、簡単または非常に難しい場合があります。
より良い方法は、 HTML Agility Packのような Web スクレイピング ライブラリを使用することです。
于 2012-10-12T18:46:09.840 に答える
0
単純な GET であると仮定すると、System.Net.WebClient を DownloadString(...) に使用し、RegExpr を使用してセルのコンテンツを探します。
于 2012-10-12T18:40:33.800 に答える
0
WebFetchを見てください。
これは、HTTP コンテンツのフェッチに関する非常に優れたチュートリアルとサンプル コードです。
于 2012-10-12T18:44:16.173 に答える