0

UbuntuのCでファイルを分割するプログラムをプログラムします。readfileでバッファを取得するときにエラーが発生します。これが私のコードです。

    int split(char *filename, unsigned long part) {
        FILE *fp;
        char *buffer;
        size_t result; // bytes read
        off_t fileSize;

        fp = fopen(filename, "rb");
        if (fp == NULL) {
            fprintf(stderr, "Cannot Open %s", filename);
            exit(2);
        }
    // Get Size
        fileSize = get_file_size(filename);
    // Buffer
        buffer = (char*) malloc(sizeof(char) * (fileSize + 1));
        if (buffer == NULL) {
            fputs("Memory error", stderr);
            fclose(fp);
            return 1;
        }
    // Copy file into buffer
    //char buffers[11];
        result = fread(buffer, 1, fileSize, fp);
        buffer[fileSize] = '\0';

        if (result != fileSize) {
            fputs("Reading error", stderr);
            return 1;
        }

    // Split file
        off_t partSize = fileSize / part;
    // Last Part
        off_t lastPartSize = fileSize - partSize * part;
        unsigned long i;
        unsigned long j;
        // create part 1 to n-1
        for (j = 0; j < part; j++) {
            char partName[255];
            char *content;
            char partNumber[3];
            // Content of file part
    //      for (i = j; i < partSize * (j + 1); i++) {
    //
    //      }
            content = (char*) malloc(sizeof(char) * partSize);
            content = copychar(buffer, j + i, partSize + i);
            i += partSize;
            //copy name
            strcpy(partName, filename);
            // part Number
            sprintf(partNumber, "%d", j);
            // file name with .part1 2 3 4 ....
            strcat(partName, ".part");
            strcat(partName, partNumber);
            // Write to file
            writeFile(partName, content);
            free(content);
        }
    // last part
    char *content;
    content = (char*) malloc(sizeof(char) * (fileSize - partSize * (part - 1)));
    content = copychar(buffer, (part - 1) * partSize + 1, fileSize);
    char lastPartNumber[3];
    char lastPartName[255];
    sprintf(lastPartNumber, "%d", part);
    strcpy(lastPartName, filename);
    strcat(lastPartName, ".part");
    strcat(lastPartName, lastPartNumber);
    writeFile(lastPartName, content);
    free(content);

    free(buffer);
    fclose(fp);
    return 0;    
}

これが最初から最後までの関数copycharです

char *copychar(char* buffer, unsigned long start, unsigned long end) {
    if (start >= end)
        return NULL;
    char *result;
    result = (char*) malloc(sizeof(char) * (end - start) + 1);
    unsigned long i;
    for (i = start; i <= end; i++)
        result[i] = buffer[i];
    result[end] = '\0';
    return result;
}

これがファイルサイズを取得する関数です

off_t get_file_size(char *filename) {
    struct stat st;
    if (stat(filename, &st) == 0)
        return st.st_size;
    fprintf(stderr, "Cannot determine size of %s: %s\n", filename);
    return -1;
}

これがファイルを書き込む機能です

    int writeFile(char* filename, char*buffer) {
    if (buffer == NULL || filename == NULL)
        return 1;
    FILE *file;
    file = fopen(filename, "wb");
    fwrite(buffer, sizeof(char), sizeof(buffer) + 1, file);
    fclose(file);
    return 0;
}

私がテストするとき、私はファイルテスト29MBを使用し、それはダンプされました。デバッグするとfileSizetrueが返されますが、バッファ内のreadfileがファイルから取得すると135文字しか返されず、copycharを使用するとエラーになります。

    Breakpoint 1, 0x0000000000400a0b in copychar (buffer=0x7ffff5e3a010 "!<arch>\ndebian-binary   1342169369  0     0     100644  4         `\n2.0\ncontrol.tar.gz  1342169369  0     0     100644  4557      `\n\037\213\b", start=4154703576, end=4164450461) at final.c:43

Program received signal SIGSEGV, Segmentation fault.
0x0000000000400a0b in copychar (buffer=0x7ffff5e3a010 "!<arch>\ndebian-binary   1342169369  0     0     100644  4         `\n2.0\ncontrol.tar.gz  1342169369  0     0     100644  4557      `\n\037\213\b", start=4154703576, end=4164450461) at final.c:43

プログラムは信号SIGSEGV、セグメンテーション違反で終了しました。プログラムはもう存在しません。

分割時に部分に書き込むためにバッファを部分に分割する方法がわかりません。よろしくお願いします!

4

2 に答える 2

1

お気づきかもしれませんが、1つの大きなブロックにファイルをコピーすることは非常に非現実的です。そして、それは必要ありません。

最も単純なレベルでは、次のようにファイルをバイトごとにコピーできます。

while( ( ch = fgetc(source) ) != EOF ) {
   fputc(ch, target);
}

これは機能しますが、かなり遅くなります。次のように、ブロックでコピーすることをお勧めします。

 unsigned char buf[4096];
 size_t size;
 while( (size = fread(buf, 1, sizeof(buf), fpRead) ) > 0) {
     fwrite(buf, 1, size, fpWrite);
 }

結果のコードははるかに単純であり、動的メモリ割り当てが含まれていないことに注意してください。

もちろん、分割ロジックを追加する必要がありますが、実際に書き込む前に、書き込まれたバイト数を追跡​​し、新しい書き込みファイルを開くことで実行できます。

編集:マルチパートファセットを処理する方法-概略的には、いくつかの特別なケースの追加のチェックと、もちろんさまざまなシステムコールのテスト結果を実装する必要があります

 unsigned char buf[4096];
 size_t size;
 size_t partsize = 100000; // asssuming you want to write 100k parts.
 size_t stilltobewritten = partsize; // bytes remaining to be written in current part
 size_t chunksize = sizeof(buf); // first time around we read full buffersize
 while( (size = fread(buf, 1, chunksize, fpRead) ) > 0) {
     fwrite(buf, 1, size, fpWrite);
     stilltobewritten -= size; // subtract bytes written from saldo
     if (stilltobewritten == 0) {
         // part is complete, close this part and open next
         fclose(fpWrite);
         fpWrite = fopen(nextpart,"wb");
         // and reinit variables
         stilltobewritten = partsize;
         chunksize = sizeof(buf);
     } else {
         // prep next round on present file - just the special case of the last block
         // to handle
         chunksize = (stilltobewritten > sizeof(buf)) ? sizeof(buf) : stilltobewritten;
     }
 }

および編集2:ファイルのパーツ名も非常に簡単にすることができます。

 sprintf(partName, "%s.part%d",file, j);
于 2012-07-28T15:08:51.730 に答える
1

元のコードに関しては、copycharstartとの間にいくつかの混乱があります。endまず、 mallocsizeof(char) * (end - start + 1)ではなく、おそらくsizeof(char) * (end - start) + 1、元のバッファ()からend-start + 1シンボルをコピーし、最後のシンボルを。でfor (i = start; i <= end; i++)上書きする'\0'ことを意味します。これは、おそらく意図した動作ではありません。

于 2012-07-28T15:13:37.717 に答える