1

文字列エンコーディング間の変換を含むいくつかのコードをテストしようとしていて、無効な UTF-8 シーケンスで NSString を作成しようとしたときにこの現象を発見しました。

char before = 0xa1;
NSString *s = [NSString stringWithFormat:@"%c",before];
char after = [s characterAtIndex:0]; // = 0xb0

0x80 から 0xFF の範囲のほとんどの (すべてではない) 文字について、NSString の文字は指定したものと同じではありません。

これがなぜなのか、誰にも分かりますか?

すべての可能な char 値の前後の値を次に示します。

1 -> 1

2 -> 2

3 -> 3

4 -> 4

5 -> 5

6 -> 6

7 -> 7

8 -> 8

9 -> 9

a -> a

b -> b

c -> c

d -> d

e -> e

f -> f

10 -> 10

11 -> 11

12 -> 12

13 -> 13

14 -> 14

15 -> 15

16 -> 16

17 -> 17

18 -> 18

19 -> 19

1a -> 1a

1b -> 1b

1c -> 1c

1日 -> 1日

1e -> 1e

1f -> 1f

20 -> 20

21 -> 21

22 -> 22

23 -> 23

24 -> 24

25 -> 25

26 -> 26

27 -> 27

28 -> 28

29 -> 29

2a -> 2a

2b -> 2b

2c -> 2c

2D -> 2D

2e -> 2e

2f -> 2f

30 -> 30

31 -> 31

32 -> 32

33 -> 33

34 -> 34

35 -> 35

36 -> 36

37 -> 37

38 -> 38

39 -> 39

3a -> 3a

3b -> 3b

3c -> 3c

3D -> 3D

3e -> 3e

3f -> 3f

40 -> 40

41 -> 41

42 -> 42

43 -> 43

44 -> 44

45 -> 45

46 -> 46

47 -> 47

48 -> 48

49 -> 49

4a -> 4a

4b -> 4b

4c -> 4c

4d -> 4d

4e -> 4e

4f -> 4f

50 -> 50

51 -> 51

52 -> 52

53 -> 53

54 -> 54

55 -> 55

56 -> 56

57 -> 57

58 -> 58

59 -> 59

5a -> 5a

5b -> 5b

5c -> 5c

5日 -> 5日

5e -> 5e

5f -> 5f

60 -> 60

61 -> 61

62 -> 62

63 -> 63

64 -> 64

65 -> 65

66 -> 66

67 -> 67

68 -> 68

69 -> 69

6a -> 6a

6b -> 6b

6c -> 6c

6日 -> 6日

6e -> 6e

6f -> 6f

70 -> 70

71 -> 71

72 -> 72

73 -> 73

74 -> 74

75 -> 75

76 -> 76

77 -> 77

78 -> 78

79 -> 79

7a -> 7a

7b -> 7b

7c -> 7c

7日 -> 7日

7e -> 7e

7f -> 7f

80 -> c4 [変更]

81 -> c5 [変更]

82 -> c7 [変更]

83 -> c9 [変更]

84 -> d1 [変更]

85 -> d6 [変更]

86 -> DC [変更]

87 -> e1 [変更]

88 -> e0 [変更]

89 -> e2 [変更]

8a -> e4 [変更]

8b -> e3 [変更]

8c -> e5 [変更]

8d -> e7 [変更]

8e -> e9 [変更]

8f -> e8 [変更]

90 -> ea [変更]

91 -> eb [変更]

92 -> 編集 [変更]

93 -> ec [変更]

94 -> ええ [変更]

95 -> ef [変更]

96 -> f1 [変更]

97 -> f3 [変更]

98 -> f2 [変更]

99 -> f4 [変更]

9a -> f6 [変更]

9b -> f5 [変更]

9c -> ファ [変更]

9d -> f9 [変更]

9e -> fb [変更]

9f -> fc [変更]

a0 -> 2020 [変更]

a1 -> b0 [変更]

a2 -> a2

a3 -> a3

a4 -> a7 [変更]

a5 -> 2022 [変更]

a6 -> b6 [変更]

a7 -> df [変更]

a8 -> ae [変更]

a9 -> a9

aa -> 2122 [変更]

ab -> b4 [変更]

ac -> a8 [変更]

広告 -> 2260 [変更]

ae -> c6 [変更]

af -> d8 [変更]

b0 -> 221e [変更]

b1 -> b1

b2 -> 2264 [変更]

b3 -> 2265 [変更]

b4 -> a5 [変更]

b5 -> b5

b6 -> 2202 [変更]

b7 -> 2211 [変更]

b8 -> 220f [変更]

b9 -> 3c0 [変更]

ba -> 222b [変更]

bb -> aa [変更]

bc -> ba [変更]

bd -> 3a9 [変更]

be -> e6 [変更]

bf -> f8 [変更]

c0 -> bf [変更]

c1 -> a1 [変更]

c2 -> ac [変更]

c3 -> 221a [変更]

c4 -> 192 [変更]

c5 -> 2248 [変更]

c6 -> 2206 [変更]

c7 -> ab [変更]

c8 -> bb [変更]

c9 -> 2026 [変更]

ca -> a0 [変更]

cb -> c0 [変更]

cc -> c3 [変更]

cd -> d5 [変更]

ce -> 152 [変更]

cf -> 153 [変更]

d0 -> 2013 [変更]

d1 -> 2014 [変更]

d2 -> 201c [変更]

d3 -> 201d [変更]

d4 -> 2018 [変更]

d5 -> 2019 [変更]

d6 -> f7 [変更]

d7 -> 25ca [変更]

d8 -> ff [変更]

d9 -> 178 [変更]

ダ -> 2044 [変更]

デシベル -> 20ac [変更]

dc -> 2039 [変更]

dd -> 203a [変更]

de -> fb01 [変更]

df -> fb02 [変更]

e0 -> 2021 [変更]

e1 -> b7 [変更]

e2 -> 201a [変更]

e3 -> 201e [変更]

e4 -> 2030 [変更]

e5 -> c2 [変更]

e6 -> ca [変更]

e7 -> c1 [変更]

e8 -> cb [変更]

e9 -> c8 [変更]

ea -> cd [変更]

eb -> ce [変更]

ec -> cf [変更]

ed -> cc [変更]

ee -> d3 [変更]

ef -> d4 [変更]

f0 -> f8ff [変更]

f1 -> d2 [変更]

f2 -> da [変更]

f3 -> デシベル [変更]

f4 -> d9 [変更]

f5 -> 131 [変更]

f6 -> 2c6 [変更]

f7 -> 2dc [変更]

f8 -> af [変更]

f9 -> 2d8 [変更]

fa -> 2d9 [変更]

fb -> 2da [変更]

fc -> b8 [変更]

fd -> 2dd [変更]

fe -> 2db [変更]

ff -> 2c7 [変更]

4

1 に答える 1