ios - Objective Cで文字列に変換するときに、char配列が末尾の文字を挿入するのはなぜですか?

Question

文字列の内容をbase64でエンコードするために、NSStringにクイックカテゴリを作成しようとしています。生成された文字列の末尾に余分な文字が表示されることを除いて、すべて問題ないようです。次のコードが以下の出力を生成する理由を誰か説明できますか?

ソース：

const char base64CharSet[64] = {
    'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H',
    'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P',
    'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X',
    'Y', 'Z', 'a', 'b', 'c', 'd', 'e', 'f',
    'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n',
    'o', 'p', 'q', 'r', 's', 't', 'u', 'v',
    'w', 'x', 'y', 'z', '0', '1', '2', '3',
    '4', '5', '6', '7', '8', '9', '+', '/'
};

const char *input = "Hello, World!";

int length = strlen(input);
int outlen = (length / 3) * 4;
int modlen = length % 3;
int rawlen = length - modlen;

if (modlen != 0)
    outlen += 4;

char output[outlen];

char inbuf[3], outbuf[4];
int inpos = 0, outpos = 0;

for (outpos = 0, inpos = 0; inpos < rawlen; inpos += 3) {
    for (int i = 0; i <  3; i++) {
        int j = inpos + i;
        inbuf[i] = j < length ? input[j] : 0;
    }

    outbuf[0] =  (inbuf[0] & 0xFC) >> 2;
    outbuf[1] = ((inbuf[0] & 0x03) << 4) | ((inbuf[1] & 0xF0) >> 4);
    outbuf[2] = ((inbuf[1] & 0x0F) << 2) | ((inbuf[2] & 0xC0) >> 6);
    outbuf[3] =  (inbuf[2] & 0x3F);

    output[outpos++] = base64CharSet[outbuf[0]];
    output[outpos++] = base64CharSet[outbuf[1]];
    output[outpos++] = base64CharSet[outbuf[2]];
    output[outpos++] = base64CharSet[outbuf[3]];
}

if (modlen > 0) {
    char modbuf[3] = {0, 0, 0};

    for (int i = 0; i < modlen; i++) {
        int j = rawlen + i;
        modbuf[i] = input[j];
    }

    outbuf[0] =  (modbuf[0] & 0xFC) >> 2;
    outbuf[1] = ((modbuf[0] & 0x03) << 4) | ((modbuf[1] & 0xF0) >> 4);
    outbuf[2] = ((modbuf[1] & 0x0F) << 2) | ((modbuf[2] & 0xC0) >> 6);
    outbuf[3] =  (modbuf[2] & 0x3F);

    output[outpos++] = base64CharSet[outbuf[0]];
    output[outpos++] = base64CharSet[outbuf[1]];
    output[outpos++] = modlen == 2 ? base64CharSet[outbuf[2]] : '=';
    output[outpos++] = '=';
}

NSLog(@"Input: '%s', Length: %zd", input, strlen(input));
NSLog(@"Output: '%s', Length: %zd, Expected Length: %d", output, strlen(output), outlen);

出力：

2013-03-19 14:46:51.568 Sandbox[19195:c07] Input: 'Hello, World!', Length: 13
2013-03-19 14:46:51.569 Sandbox[19195:c07] Output: 'SGVsbG8sIFdvcmxkIQ==wä]', Length: 23, Expected Length: 20

score 4 · Accepted Answer

2013-03-19 14:46:51.569 Sandbox[19195:c07] Output: 'SGVsbG8sIFdvcmxkIQ==wä]', Length: 23, Expected Length: 20

最後のグーバーは、出力バッファーを NULL で終了しなかったためです。C 文字列では、文字列の最後の文字の後の文字が 0 である必要があります (ASCII の "0" ではなく、すべてのビットが 0 です:)。

... 完全な配列に追加すると、例外が発生します ...

Cへようこそ！その言語は、はさみを持って走ることに似ています。転んでも怪我をすることはありません。ではないかもしれない。

この場合、実際には NULL バイトを書き込んでいないため、C 文字列の出力は、文字列配列の後にたまたまスタックにあるものを読み取っているだけです。バッファが適切なサイズであるかどうかを判断するためにコードを監査しませんでした。

すべての計算が正しいと仮定すると、エンコーディングに必要な長さよりも 1 バイト長くなるようにバッファーを割り当て、そこにターミネーターをドロップできます。

char output[outlen + 1];
output[outlen + 1] = 0;

ios - Objective Cで文字列に変換するときに、char配列が末尾の文字を挿入するのはなぜですか?

1 に答える 1

Related

Reference