コンテンツがフランス語のサイトがあります。
今、私はこれらを c# を使用してコンソール アプリケーションでHttpWebRequest
取得したいと考えています。HttpWebResponse
public string GetContents(string url)
{
StreamReader _Answer;
try
{
HttpWebRequest WebReq = (HttpWebRequest)WebRequest.Create(url);
WebReq.Headers.Add(HttpRequestHeader.AcceptEncoding, "utf-8");
WebReq.UserAgent = "Mozilla/4.0 (compatible; MSIE 6.0;Windows NT 5.1;)";
WebReq.ContentType = "application/x-www-form-urlencoded";
HttpWebResponse WebResp = (HttpWebResponse)WebReq.GetResponse();
Stream Answer = WebResp.GetResponseStream();
Encoding encode = System.Text.Encoding.GetEncoding("utf-8");
_Answer = new StreamReader(Answer, Encoding.UTF8);
return _Answer.ReadToEnd();
}
catch
{
}
return "";
}
コンテンツを取得しましたが、四角などの奇妙な記号が含まれています。