重複の可能性:
C# で HTML 文字をデコードするにはどうすればよいですか?
strToCheck の下の文字列を html エンコード バージョンから実際の UTF-8 表現に変換する際に問題があります。
// Code sample:
string result = null;
// HTML-encoded Input String (From Google Translate API) , renders "भारत महान देश है." in Hindi language.
string strTocheck = "भारत महान देश है.";
using (var sw = new StreamWriter(File.Open(@"c:\myfile.txt", FileMode.OpenOrCreate), Encoding.UTF8)) // UTF-8 encoding
{
sw.WriteLine(strTocheck);
}
System.IO.StreamReader reader = new System.IO.StreamReader(@"c:\myfile.txt", Encoding.UTF8); // UTF-8 encoding
result = reader.ReadToEnd();
MessageBox.Show(result);
// I expected "भारत महान देश है."
// But got output : भारत महान देश है.
どんな助けでも大歓迎です。ありがとうございました。
画像はこちら(新しいタブで開いてください) >> http://i.stack.imgur.com/xcctU.png