私はこれを機能させるために永遠に努力してきました。プログラムは、バッファ サイズ用の on とファイル名用の 2 つの引数を取り、そのファイル形式を UTF-32 から UTF-8 に変換することになっています。fgetc() 関数を使用して、int 配列に Unicode コードポイントを入力しました。バッファの内容を出力する printint をテストしましたが、各コードポイントの代わりにこれらすべてのヌル文字が含まれています。
たとえば、文字「A」のみで構成されるファイルの場合: バッファ [0] は 0 バッファ [1] は 0 バッファ [2] は 0 バッファ [3] は 41
U+7F を超えるコードポイントは、最終的に分割されます。
バッファを初期化するためのコードは次のとおりです。
int main(int argc, char** argv) {
if (argc != 3) {
printf("Must input a buffer size and a file name :D");
return 0;
}
FILE* input = fopen(argv[2], "r");
if (!input) {
printf("The file %s does not exist.", argv[1]);
return 0;
} else {
int bufferLimit = atoi(argv[1]);
int buffer[bufferLimit];
int charReplaced = 0;
int fileEndReached = 0;
int i = 0;
int j = 0;
while(1) {
// fill the buffer with the characters from the file.
for(i = 0; i < bufferLimit; i++){
buffer[i] = fgetc(input);
// if EOF reached, move onto next step and mark that
// it has finished.
if (buffer[i] == EOF) {
fileEndReached = 1;
break;
}
}
// output buffer of chars until EOF or end of buffer
for(j = 0; j <= i; j++) {
if(buffer[j] == EOF) {
break;
}
// check for Character Replacements
charReplaced += !convert(buffer[j]);
}
if(fileEndReached != 0) {
break;
}
}
//return a 1 if any Character Replacements were used
if(charReplaced != 0) {
return 1;
}
}
}