2

こんにちは、私はこの問題を抱えています。サーバーから、JSON 文字列を Unicode エスケープ シーケンスとして取得します。このシーケンスを Unicode 文字列に変換する必要があります。いくつかの解決策を見つけましたが、すべての json 応答に対して機能するわけではありません。

たとえば、サーバーからこの文字列を取得します。

string encodedText="{\"DATA\":{\"idUser\":18167521,\"nick\":\"KecMessanger2\",\"photo\":\"1\",\"sex\":1,\"photoAlbums\":0,\"videoAlbums\":0,\"sefNick\":\"kecmessanger2\",\"profilPercent\":0,\"emphasis\":false,\"age\":25,\"isBlocked\":false,\"PHOTO\":{\"normal\":\"http://213.215.107.125/fotky/1816/75/n_18167521.jpg?v=1\",\"medium\":\"http://213.215.107.125/fotky/1816/75/m_18167521.jpg?v=1\",\"24x24\":\"http://213.215.107.125/fotky/1816/75/s_18167521.jpg?v=1\"},\"PLUS\":{\"active\":false,\"activeTo\":\"0000-00-00\"},\"LOCATION\":{\"idRegion\":\"1\",\"regionName\":\"Banskobystricku00fd kraj\",\"idCity\":\"109\",\"cityName\":\"Rimavsku00e1 Sobota\"},\"STATUS\":{\"isLoged\":true,\"isChating\":false,\"idChat\":0,\"roomName\":\"\",\"lastLogin\":1291898043},\"PROJECT_STATUS\":{\"photoAlbums\":0,\"photoAlbumsFavs\":0,\"videoAlbums\":0,\"videoAlbumsFavs\":0,\"videoAlbumsExts\":0,\"blogPosts\":0,\"emailNew\":0,\"postaNew\":0,\"clubInvitations\":0,\"dashboardItems\":26},\"STATUS_MESSAGE\":{\"statusMessage\":\"Nepru00edtomnu00fd.\",\"addTime\":\"1291887539\"},\"isFriend\":false,\"isIamFriend\":false}}"; 

jsonstring の statusMessage は Nepru00edtomnu00fd で構成され .net Unicode 文字列ではNeprítomnýです。

jsonstring の領域は、.net Unicode 文字列のBanskobystricku00fdで構成され、 BanskoBystrickýです。

その他の例:

  1. Nepru00edtomnu00fd -> Neprítomný
  2. Banskobystricku00fd -> BanskoBystricý
  3. Trenu010du00edn -> トレンチーン

Unicode エスケープ シーケンスをスロバキア語の .net 文字列に変換する必要があります。

変換時にこの機能を使用しました:

private static string UnicodeStringToNET(string input)
{
    var regex = new Regex(@"\\[uU]([0-9A-F]{4})", RegexOptions.IgnoreCase);
    return input = regex.Replace(input, match => ((char)int.Parse(match.Groups[1].Value,
      NumberStyles.HexNumber)).ToString());
}

どこに問題がありますか?

4

2 に答える 2

2

これは、私が仕事をするために書いたメソッド(以前の回答に基づく)です。\uhhhh と \Uhhhhhhhh の両方を処理し、エスケープされた Unicode エスケープを保持します (したがって、文字列にリテラルの \uffff を含める必要がある場合は、それを行うことができます)。一時的なプレースホルダー文字 \uf00b は私的使用領域にあるため、通常、Unicode 文字列では使用されません。

    public static string ParseUnicodeEscapes(string escapedString)
    {
        const string literalBackslashPlaceholder = "\uf00b";
        const string unicodeEscapeRegexString = @"(?:\\u([0-9a-fA-F]{4}))|(?:\\U([0-9a-fA-F]{8}))";
        // Replace escaped backslashes with something else so we don't
        // accidentally expand escaped unicode escapes.
        string workingString = escapedString.Replace("\\\\", literalBackslashPlaceholder);

        // Replace unicode escapes with actual unicode characters.
        workingString = new Regex(unicodeEscapeRegexString).Replace(workingString,
            match => ((char) Int32.Parse(match.Value.Substring(2), NumberStyles.HexNumber))
            .ToString(CultureInfo.InvariantCulture));

        // Replace the escaped backslash placeholders with non-escaped literal backslashes.
        workingString = workingString.Replace(literalBackslashPlaceholder, "\\");
        return workingString;
    }
于 2012-03-30T18:44:50.923 に答える
1

エスケープ シーケンスは「\u00fd」のような \ で始まらないため、正規表現は

"[uU]([0-9A-F]{4})"

...

于 2010-12-09T13:13:18.647 に答える