c - FFMPEG ビデオエンコーディングについて

Question

これは、ffmpeg のエンコーディングの例から取得しました。オーディオエンコーディングについては著者の例にいくらか従うことができますが、C コードを見て困惑していることに気づきます (私が話していることを参照するのに役立つように、ブロック番号にコメントを付けました)...

static void video_encode_example(const char *filename)
{
AVCodec *codec;
AVCodecContext *c= NULL;
int i, out_size, size, x, y, outbuf_size;
FILE *f;
AVFrame *picture;
uint8_t *outbuf, *picture_buf;              //BLOCK ONE
printf("Video encoding\n");

/* find the mpeg1 video encoder */
codec = avcodec_find_encoder(CODEC_ID_MPEG1VIDEO);
if (!codec) {
    fprintf(stderr, "codec not found\n");
    exit(1);                                //BLOCK TWO
}

c= avcodec_alloc_context();
picture= avcodec_alloc_frame();
/* put sample parameters */
c->bit_rate = 400000;
/* resolution must be a multiple of two */
c->width = 352;
c->height = 288;
/* frames per second */
c->time_base= (AVRational){1,25};
c->gop_size = 10; /* emit one intra frame every ten frames */
c->max_b_frames=1;
c->pix_fmt = PIX_FMT_YUV420P;                   //BLOCK THREE

/* open it */
if (avcodec_open(c, codec) < 0) {
    fprintf(stderr, "could not open codec\n");
    exit(1);
}
f = fopen(filename, "wb");
if (!f) {
    fprintf(stderr, "could not open %s\n", filename);
    exit(1);
}                                               //BLOCK FOUR

/* alloc image and output buffer */
outbuf_size = 100000;
outbuf = malloc(outbuf_size);
size = c->width * c->height;
picture_buf = malloc((size * 3) / 2); /* size for YUV 420 */
picture->data[0] = picture_buf;
picture->data[1] = picture->data[0] + size;
picture->data[2] = picture->data[1] + size / 4;
picture->linesize[0] = c->width;
picture->linesize[1] = c->width / 2;
picture->linesize[2] = c->width / 2;              //BLOCK FIVE

/* encode 1 second of video */
for(i=0;i<25;i++) {
    fflush(stdout);
    /* prepare a dummy image */
    /* Y */
    for(y=0;y<c->height;y++) {
        for(x=0;x<c->width;x++) {
            picture->data[0][y * picture->linesize[0] + x] = x + y + i * 3;
        }
    }                                            //BLOCK SIX

    /* Cb and Cr */
    for(y=0;y<c->height/2;y++) {
        for(x=0;x<c->width/2;x++) {
            picture->data[1][y * picture->linesize[1] + x] = 128 + y + i * 2;
            picture->data[2][y * picture->linesize[2] + x] = 64 + x + i * 5;
        }
    }                                           //BLOCK SEVEN

    /* encode the image */
    out_size = avcodec_encode_video(c, outbuf, outbuf_size, picture);
    printf("encoding frame %3d (size=%5d)\n", i, out_size);
    fwrite(outbuf, 1, out_size, f);
}                                              //BLOCK EIGHT

/* get the delayed frames */
for(; out_size; i++) {
    fflush(stdout);
    out_size = avcodec_encode_video(c, outbuf, outbuf_size, NULL);
    printf("write frame %3d (size=%5d)\n", i, out_size);
    fwrite(outbuf, 1, out_size, f);
}                                             //BLOCK NINE

/* add sequence end code to have a real mpeg file */
outbuf[0] = 0x00;
outbuf[1] = 0x00;
outbuf[2] = 0x01;
outbuf[3] = 0xb7;
fwrite(outbuf, 1, 4, f);
fclose(f);
free(picture_buf);
free(outbuf);
avcodec_close(c);
av_free(c);
av_free(picture);
}                                            //BLOCK TEN

ブロックごとに作成者のコードから取得できるものは次のとおりです...

ブロック 1: 変数とポインターの初期化。ffmpeg ソースコードで AVFrame 構造体をまだ見つけることができなかったので、何を参照しているのかわかりません

ブロック 2: 近くに見つからない場合は、ファイルのコーデックを使用します。

ブロック 3: サンプルビデオパラメータを設定します。私が本当に得られない唯一のものはgopサイズです。イントラフレームについて読みましたが、まだそれが何であるかわかりません。

ブロック 4: ファイルを書き込み用に開く...

ブロック 5: ここから彼らは本当に私を失い始めます。一部は、おそらく AVFrame が何であるかを正確に知らないためですが、なぜ画像サイズの 3/2 しか使用しないのですか?

ブロック 6 & 7: 彼らがこの数学で何を達成しようとしているのか理解できません。

ブロック 8: avcodec 関数がここですべての作業を行っているように見えますが、当面は関係ありません..

ブロック 9: ループの 25 フレームの外側にあるので、残りのフレームを取得すると思いますか?

ブロック 10: 閉じる、メモリを解放するなど...

これは混同される大きなコードブロックであることはわかっています。どんな入力でも役に立ちます。仕事で頭からかぶった。よろしくお願いします。

score 4 · Accepted Answer

HonkyTonk が既に回答しているように、コメントはそれを綴っています: ダミーの画像を用意してください。特に YUV/YCbCr 色空間に慣れていない場合は、ダミー画像がどのように生成されるかについて混乱する可能性があると思います。基本についてはウィキペディアの扱いを読んでください。

多くのビデオコーデックは、YUV 色空間で動作します。これは、RGB の扱いにしか慣れていないプログラマーを混乱させることがよくあります。エグゼクティブサマリーは、このバリエーション (YUV 4:2:0 平面) の場合、イメージ内の各ピクセルが Y サンプルを取得し (Y ループがすべての (x,y) ペアを反復することに注意してください)、2x2 ピクセルがそれぞれクワッドします。 U/Cb サンプルと V/Cr サンプルを共有します (ブロック 7 で、反復が width/2 と height/2 を超えていることに注意してください)。

生成されたパターンはある種のグラデーションのようです。既知の変更を生成する場合は、Y/Cb/Cr を 0 に設定すると、ダミーイメージはすべて緑色になります。Cb と Cr を 128 に設定し、Y を 255 に設定して白いフレームを取得します。Y を 0 にスライドして黒を表示します。グレーの色合いを確認するには、Cb と Cr を 128 に保持しながら、Y をその間の任意の値に設定します。

c - FFMPEG ビデオ エンコーディングについて

2 に答える 2

Related

Reference

c - FFMPEG ビデオエンコーディングについて