0

GsmArena サイトをフィルタリングし、すべてのスマートフォンの情報をユーザーに表示する Windows ストア アプリケーションを開発しています。しかし、この情報を取得する方法がわかりません。誰か助けてくれませんか?

4

1 に答える 1

1

このような情報は、 Html Agility Packを使用して簡単に抽出できます。

Firefox を使用してページのソースを表示すると、ビジュアル レンダリングと html の対応を確認できます。 ここに画像の説明を入力

次に、各電話の情報が div クラス「news-item」内にラップされていることがわかります。次に、以下のスニペットを試して、すべての新しいアイテムを正確に処理してください。

private const string RemoteRoot = @"http://www.gsmarena.com/";
private WebClient _client = new WebClient();
_client.DownloadFile(remoteLink, localPath);  //Save it to a local file

または、Html Agility Pack を使用して Web からファイルをダウンロードできます。

var web = new HtmlWeb();
var doc = web.Load(remoteLink);
doc.Save(localPath);

次に、必要な情報を取得できます。

var doc = new HtmlDocument();
doc.Load(localPath);
var filter = string.Format(@"//*[@class='{0}']", "news-item");
var nodes = doc.DocumentNode.SelectNodes(filter); // here you have all new items
//you can then retrive h3 texts etc.
于 2013-05-29T05:37:06.313 に答える