c# - タイプ 'string' を 'HtmlAgilityPack.HtmlDocument' に変換できませんか?

Question

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Net;
using HtmlAgilityPack;

namespace sss
{
    public class Downloader
    {
        WebClient client = new WebClient();

        public HtmlDocument FindMovie(string Title)
        { 
            //This will be implemented later on, it will search movie.
        }

        public HtmlDocument FindKnownMovie(string ID)
        {
            HtmlDocument Page = (HtmlDocument)client.DownloadString(String.Format("http://www.imdb.com/title/{0}/", ID));
        }
    }
}

ダウンロードした文字列を有効な HtmlDocument に変換して、HTMLAgilityPack を使用して解析できるようにするにはどうすればよいですか?

score 6 · Accepted Answer

これは v1.4 で動作するはずです:

HtmlWeb hw = new HtmlWeb();
HtmlDocument doc = hw.Load(string.Format("http://www.imdb.com/title/{0}/", ID));

また

string html = client.DownloadString(String.Format("http://www.imdb.com/title/{0}/", ID));
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(html);

score 5 · Accepted Answer

これを試してください（このかなり古いドキュメントに基づいています）：

string url = String.Format("http://www.imdb.com/title/{0}/", ID);
string content = client.DownloadString(url);
HtmlDocument page = new HtmlDocument();
page.LoadHtml(content);

基本的に、キャストが 2 つの型の間の正しい変換方法になることはめったにありません。特に、解析などの処理が行われている場合はそうです。

score 1 · Accepted Answer

次のコード行はHtmlDocument、コンテンツでを作成します。

// First create a blank document
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
// Then load it with the content from the webpage you are trying to parse
doc.Load(new StreamReader(WebRequest.Create("yourURL").GetResponse()
                                 .GetResponseStream()));

score 0 · Accepted Answer

おそらく、ファイルシステム用に新しいファイル (.html) を作成し、ストリームライターを使用して文字列を html ファイルに書き込むことができます。次に、そのファイルをパーサーに渡します

c# - タイプ 'string' を 'HtmlAgilityPack.HtmlDocument' に変換できませんか?

4 に答える 4

Related

Reference