0

htmlサイトのコンテンツを読むには、WebClientを使用します。

WebClient client = new WebClient();
byte[] html      = client.DownloadData(url);
UTF8Encoding utf = new UTF8Encoding();
return utf.GetString(html);

サイトがwww.bet365.comのような場合の問題。オッズはswfで表示されます。オッズを読み取るにはどうすればよいですか?Ctrl+UまたはFirebugでMozillaのサイトのコンテンツをイベント表示できません。IE(F12)では検査が機能します。

ありがとう

4

2 に答える 2

1

私の知る限り、Flashコンテンツをスクレイプすることはできません。

ただし、できることは、FiddlerWiresharkなどのプロキシツールを使用して、.swfによって開始されたHTTPトラフィックをスニッフィングし、暗号化されていないことを祈ることです。

これらのHTTPリクエストを分析することで、データを取得するリクエストを抽出し、WebClientまたはを使用して自動化することができますHttpWebRequest

ただし、データ抽出を自動化する前に、それが許可されていることと、Webサイトの利用規約に違反していないことを確認してください。

于 2012-05-17T19:45:26.327 に答える
0

彼らはアフィリエイトに配布するxmlフィードを持っており、誰も実際のサイトをスクレイピングしていません

于 2013-04-24T22:34:05.047 に答える