文字列エンコーディング間の変換を含むいくつかのコードをテストしようとしていて、無効な UTF-8 シーケンスで NSString を作成しようとしたときにこの現象を発見しました。
char before = 0xa1;
NSString *s = [NSString stringWithFormat:@"%c",before];
char after = [s characterAtIndex:0]; // = 0xb0
0x80 から 0xFF の範囲のほとんどの (すべてではない) 文字について、NSString の文字は指定したものと同じではありません。
これがなぜなのか、誰にも分かりますか?
すべての可能な char 値の前後の値を次に示します。
1 -> 1
2 -> 2
3 -> 3
4 -> 4
5 -> 5
6 -> 6
7 -> 7
8 -> 8
9 -> 9
a -> a
b -> b
c -> c
d -> d
e -> e
f -> f
10 -> 10
11 -> 11
12 -> 12
13 -> 13
14 -> 14
15 -> 15
16 -> 16
17 -> 17
18 -> 18
19 -> 19
1a -> 1a
1b -> 1b
1c -> 1c
1日 -> 1日
1e -> 1e
1f -> 1f
20 -> 20
21 -> 21
22 -> 22
23 -> 23
24 -> 24
25 -> 25
26 -> 26
27 -> 27
28 -> 28
29 -> 29
2a -> 2a
2b -> 2b
2c -> 2c
2D -> 2D
2e -> 2e
2f -> 2f
30 -> 30
31 -> 31
32 -> 32
33 -> 33
34 -> 34
35 -> 35
36 -> 36
37 -> 37
38 -> 38
39 -> 39
3a -> 3a
3b -> 3b
3c -> 3c
3D -> 3D
3e -> 3e
3f -> 3f
40 -> 40
41 -> 41
42 -> 42
43 -> 43
44 -> 44
45 -> 45
46 -> 46
47 -> 47
48 -> 48
49 -> 49
4a -> 4a
4b -> 4b
4c -> 4c
4d -> 4d
4e -> 4e
4f -> 4f
50 -> 50
51 -> 51
52 -> 52
53 -> 53
54 -> 54
55 -> 55
56 -> 56
57 -> 57
58 -> 58
59 -> 59
5a -> 5a
5b -> 5b
5c -> 5c
5日 -> 5日
5e -> 5e
5f -> 5f
60 -> 60
61 -> 61
62 -> 62
63 -> 63
64 -> 64
65 -> 65
66 -> 66
67 -> 67
68 -> 68
69 -> 69
6a -> 6a
6b -> 6b
6c -> 6c
6日 -> 6日
6e -> 6e
6f -> 6f
70 -> 70
71 -> 71
72 -> 72
73 -> 73
74 -> 74
75 -> 75
76 -> 76
77 -> 77
78 -> 78
79 -> 79
7a -> 7a
7b -> 7b
7c -> 7c
7日 -> 7日
7e -> 7e
7f -> 7f
80 -> c4 [変更]
81 -> c5 [変更]
82 -> c7 [変更]
83 -> c9 [変更]
84 -> d1 [変更]
85 -> d6 [変更]
86 -> DC [変更]
87 -> e1 [変更]
88 -> e0 [変更]
89 -> e2 [変更]
8a -> e4 [変更]
8b -> e3 [変更]
8c -> e5 [変更]
8d -> e7 [変更]
8e -> e9 [変更]
8f -> e8 [変更]
90 -> ea [変更]
91 -> eb [変更]
92 -> 編集 [変更]
93 -> ec [変更]
94 -> ええ [変更]
95 -> ef [変更]
96 -> f1 [変更]
97 -> f3 [変更]
98 -> f2 [変更]
99 -> f4 [変更]
9a -> f6 [変更]
9b -> f5 [変更]
9c -> ファ [変更]
9d -> f9 [変更]
9e -> fb [変更]
9f -> fc [変更]
a0 -> 2020 [変更]
a1 -> b0 [変更]
a2 -> a2
a3 -> a3
a4 -> a7 [変更]
a5 -> 2022 [変更]
a6 -> b6 [変更]
a7 -> df [変更]
a8 -> ae [変更]
a9 -> a9
aa -> 2122 [変更]
ab -> b4 [変更]
ac -> a8 [変更]
広告 -> 2260 [変更]
ae -> c6 [変更]
af -> d8 [変更]
b0 -> 221e [変更]
b1 -> b1
b2 -> 2264 [変更]
b3 -> 2265 [変更]
b4 -> a5 [変更]
b5 -> b5
b6 -> 2202 [変更]
b7 -> 2211 [変更]
b8 -> 220f [変更]
b9 -> 3c0 [変更]
ba -> 222b [変更]
bb -> aa [変更]
bc -> ba [変更]
bd -> 3a9 [変更]
be -> e6 [変更]
bf -> f8 [変更]
c0 -> bf [変更]
c1 -> a1 [変更]
c2 -> ac [変更]
c3 -> 221a [変更]
c4 -> 192 [変更]
c5 -> 2248 [変更]
c6 -> 2206 [変更]
c7 -> ab [変更]
c8 -> bb [変更]
c9 -> 2026 [変更]
ca -> a0 [変更]
cb -> c0 [変更]
cc -> c3 [変更]
cd -> d5 [変更]
ce -> 152 [変更]
cf -> 153 [変更]
d0 -> 2013 [変更]
d1 -> 2014 [変更]
d2 -> 201c [変更]
d3 -> 201d [変更]
d4 -> 2018 [変更]
d5 -> 2019 [変更]
d6 -> f7 [変更]
d7 -> 25ca [変更]
d8 -> ff [変更]
d9 -> 178 [変更]
ダ -> 2044 [変更]
デシベル -> 20ac [変更]
dc -> 2039 [変更]
dd -> 203a [変更]
de -> fb01 [変更]
df -> fb02 [変更]
e0 -> 2021 [変更]
e1 -> b7 [変更]
e2 -> 201a [変更]
e3 -> 201e [変更]
e4 -> 2030 [変更]
e5 -> c2 [変更]
e6 -> ca [変更]
e7 -> c1 [変更]
e8 -> cb [変更]
e9 -> c8 [変更]
ea -> cd [変更]
eb -> ce [変更]
ec -> cf [変更]
ed -> cc [変更]
ee -> d3 [変更]
ef -> d4 [変更]
f0 -> f8ff [変更]
f1 -> d2 [変更]
f2 -> da [変更]
f3 -> デシベル [変更]
f4 -> d9 [変更]
f5 -> 131 [変更]
f6 -> 2c6 [変更]
f7 -> 2dc [変更]
f8 -> af [変更]
f9 -> 2d8 [変更]
fa -> 2d9 [変更]
fb -> 2da [変更]
fc -> b8 [変更]
fd -> 2dd [変更]
fe -> 2db [変更]
ff -> 2c7 [変更]