0

Webサイトから特定の情報を取得しようとしています。私のコードを見るとわかるように、今私はこのhtml文字列を持っています。ウェブサイトのhtmlソースコードは「responseText」に配置されています。If ステートメントを使用してこれを実行できることはわかっていますが、非常に面倒です。私は初心者なので、これで何をしているのかわかりません。Web サイトから情報を取得するための別の簡単な方法があるに違いないと確信しています...これは Windows ストアの C# であるため、webclient を使用できません。このコードは文字列を取得しますが、html コードを削除して変数などだけを残す方法はありませんか? Webページに対してこれを実行したいだけで、Webページのhtmlコードを見たので、必要な変数を知っています。ウェブサイトからの情報を含む変数のリストを要求する方法ではありませんか? 私はここでちょっと迷っています。

     StringBuilder sb = new StringBuilder();
     // used on each read operation
    byte[] buf = new byte[8192];
    // prepare the web page we will be asking for
    HttpClient searchClient;
    searchClient = new HttpClient();
    searchClient.MaxResponseContentBufferSize = 256000;
    HttpResponseMessage response = await searchClient.GetAsync(url);
    response.EnsureSuccessStatusCode();
    responseText = await response.Content.ReadAsStringAsync();
4

1 に答える 1

0

このコードは文字列を取得しますが、html コードを削除して変数などだけを残す方法はありませんか?

「変数」とは?HTML を取得します。これは Web サーバーからの応答です。その HTML を取り除きたい場合、それはあなた次第です。作業を快適にするためにHTML Tidyを使用することもできますが、HTML から関連情報を抽出するかどうかはあなた次第です。HTML は、生の情報源として機械で読み取れるようには設計されていません。人間に提示するためのマークアップとして設計されています。

プレゼンテーション情報などを含まない、より機械に適したソースで情報を入手できるかどうかを調査する必要があります。たとえば、JSON または XML としてデータを取得する何らかの方法がある場合があります。

于 2013-06-04T13:19:20.893 に答える