「+4」シーケンスを切り捨てる Utf7Encoding クラスに問題がありました。なぜこれが起こったのかを知りたいと思います。byte[] 配列から文字列を取得するために Utf8Encoding を試しましたが、うまくいくようです。Utf8 でそのような既知の問題はありますか? 基本的に、この変換によって生成された出力を使用して、rtf 文字列から html を作成します。
スニペットは次のとおりです。
UTF7Encoding utf = new UTF7Encoding();
UTF8Encoding utf8 = new UTF8Encoding();
string test = "blah blah 9+4";
char[] chars = test.ToCharArray();
byte[] charBytes = new byte[chars.Length];
for (int i = 0; i < chars.Length; i++)
{
charBytes[i] = (byte)chars[i];
}
string resultString = utf8.GetString(charBytes);
string resultStringWrong = utf.GetString(charBytes);
Console.WriteLine(resultString); //blah blah 9+4
Console.WriteLine(resultStringWrong); //blah 9