WebRequest
C#の a に問題があります。グーグルのページです。
ヘッダーの状態
text/html; charset=ISO-8859-1
ウェブサイトの状態
<meta http-equiv=content-type content="text/html; charset=utf-8">
そして最後に、デバッガーと正規表現で期待される結果のみを取得しますEncoding.Default
。System.Text.SBCSCodePageEncoding
今、私は何をしますか?これがどのように発生するのか、またはこの問題をどのように解決できるのか、ヒントはありますか?
ページの実際のエンコーディングは UTF-8 のようです。少なくとも FF は、Windows-Whatever やLatin1ではなく、UTF-8 で正しく表示します。
URLはこちら
問題は、すべてのドイツ語のウムラウトと同様に € 記号です。
私を真剣に夢中にさせているこの問題について、あなたの助けを前もってありがとう!
更新:文字列を出力するとき
// create a writer and open the file
TextWriter tw = new StreamWriter("test.txt");
// write a line of text to the file
tw.WriteLine(html);
// close the stream
tw.Close();
それはすべて正常に動作します。
したがって、問題は、デバッガーが正しいエンコーディングを表示せず、正規表現も表示しないことです。
C# に RegEx を UTF-8 として処理するように指示するにはどうすればよいですか?