c++ - openGL コンテキストをビデオ出力として保存する

Question

現在、作成したアニメーションをopenGLビデオファイルに保存しようとしています。を使用してみましたopenCVがvideowriter、効果がありません。スナップショットを生成し、ライブラリをbmp使用して保存することに成功しました。SDLすべてのスナップショットを保存してからを使用してビデオを生成すると、ffmpeg4 GB 相当の画像を収集するようなものになります。実用的ではありません。レンダリング中にビデオフレームを直接書き込むにはどうすればよいですか? ここで、必要なときにスナップショットを作成するために使用するコード:

void snapshot(){
SDL_Surface* snap = SDL_CreateRGBSurface(SDL_SWSURFACE,WIDTH,HEIGHT,24, 0x000000FF, 0x0000FF00, 0x00FF0000, 0);
char * pixels = new char [3 *WIDTH * HEIGHT];
glReadPixels(0, 0,WIDTH, HEIGHT, GL_RGB, GL_UNSIGNED_BYTE, pixels);

for (int i = 0 ; i <HEIGHT ; i++)
    std::memcpy( ((char *) snap->pixels) + snap->pitch * i, pixels + 3 * WIDTH * (HEIGHT-i - 1), WIDTH*3 );

delete [] pixels;
SDL_SaveBMP(snap, "snapshot.bmp");
SDL_FreeSurface(snap);
}

ビデオ出力が必要です。ffmpegを使用して C++ コードからビデオを作成できることを発見しましたが、プロセスを理解できませんでした。助けてください！

EDIT :openCV CvVideoWriterクラスを使用してみましたが、プログラムが宣言された瞬間にプログラムがクラッシュ (" segmentation fault") します。もちろん、コンパイルではエラーは表示されません。それに対する提案はありますか？

PYTHON ユーザー向けの解決策(書き込み先の形式の , , , コーデックが必要Python2.7ですpython-imaging。python-opengl私python-opencvはを使用していますUbuntu 14.04 64-bit):

def snap():
    pixels=[]
    screenshot = glReadPixels(0,0,W,H,GL_RGBA,GL_UNSIGNED_BYTE)
    snapshot = Image.frombuffer("RGBA",W,H),screenshot,"raw","RGBA",0,0)
    snapshot.save(os.path.dirname(videoPath) + "/temp.jpg")
    load = cv2.cv.LoadImage(os.path.dirname(videoPath) + "/temp.jpg")
    cv2.cv.WriteFrame(videoWriter,load)

WとはウィンドウHの寸法 (幅、高さ) です。何が起こっているかというと、glReadPixelsコマンドから読み取った生のピクセルを画像に変換するために PIL を使用していJPEGます。その JPEG をopenCV画像に読み込み、ビデオライターに書き込みます。PIL イメージをビデオライターに直接使用することで特定の問題が発生していましたが (これにより、何百万ものクロックサイクルが節約されますI/O)、現在はそれに取り組んでいません。モジュールImageですモジュールです。PILcv2python-opencv

score 16 · Accepted Answer

コマンドラインユーティリティを使用しているように聞こえます: ffmpeg. コマンドラインを使用して静止画像のコレクションからビデオをエンコードするのではなく、とを使用する必要がlibavcodecありlibavformatます。これらffmpegは実際に構築されたライブラリであり、別のプログラムを使用せずにビデオをエンコードし、標準のストリーム/インターチェンジ形式 (RIFF/AVI など) で保存できます。

これを実装するためのチュートリアルはおそらくあまりないでしょう。なぜなら、これは伝統的に人々がffmpeg別の方法で使用したいと思っていたからです。つまり、OpenGL で表示するためにさまざまなビデオ形式をデコードします。PS4 および Xbox One コンソールへのゲームプレイビデオエンコーディングの導入により、これはすぐに変わると思います。この機能に対する需要が突然急増するでしょう。

ただし、一般的なプロセスは次のとおりです。

コンテナ形式とコーデックを選択
- 多くの場合、一方が他方を決定します (例: MPEG-2 + MPEG プログラムストリーム)。
静止フレームでバッファを埋め始める
静止フレームのバッファを定期的にエンコードし、出力に書き込みます (MPEG 用語でのパケット書き込み)。
- これは、バッファーがいっぱいになったとき、または n ミリ秒ごとに行います。ビデオをライブでストリーミングするかどうかに応じて、どちらかを好む場合があります。
プログラムが終了したら、バッファをフラッシュしてストリームを閉じます

これについての 1 つの良い点は、実際にファイルに書き込む必要がないことです。静止フレームのバッファからデータのパケットを定期的にエンコードしているため、必要に応じて、エンコードされたビデオをネットワーク経由でストリーミングできます。これが、コーデックとコンテナー (交換) 形式が分離されている理由です。

もう 1 つの良い点は、CPU と GPU を同期する必要がないことです。ピクセルバッファーオブジェクトをセットアップし、GPU の数フレーム遅れて OpenGL がデータを CPU メモリにコピーできるようにします。これにより、ビデオのリアルタイムエンコーディングの負荷が大幅に軽減されます。ビデオレイテンシの要求が不合理でない場合は、ビデオをエンコードしてディスクまたはネットワーク経由で定期的にフラッシュするだけで済みます。これはリアルタイムレンダリングで非常にうまく機能します。これは、常に CPU スレッドをエンコーディングでビジー状態に保つのに十分な大きさのデータプールがあるためです。

フレームのエンコードは、フレームの大きなバッファーに十分なストレージを提供する GPU でリアルタイムで実行することもできます (最終的にエンコードされたデータを GPU から CPU にコピーする必要があり、これをできるだけ頻繁に実行したくないため)。明らかに、これはを使用して行われるわけではありませんffmpeg。この目的のために CUDA / OpenCL / 計算シェーダーを使用する特殊なライブラリがあります。私はそれらを使用したことはありませんが、存在します。

移植性のために、非同期の GPU->CPU コピーには libavcodec と Pixel Buffer Objects を使用する必要があります。最近の CPU には十分なコアがあり、十分なフレームをバッファリングし、複数の同時スレッドでエンコードする場合 (これにより、同期オーバーヘッドが追加され、エンコードされたビデオを出力する際のレイテンシが増加します)、または単純にフレームをドロップするか、解像度を下げる (貧乏人の解決策）。

ここでは、SDL の範囲をはるかに超える多くの概念について説明していますが、現在のソリューションよりも優れたパフォーマンスでこれを行う方法を尋ねました。つまり、OpenGL Pixel Buffer Objects を使用してデータを転送し、libavcodec をエンコードに使用します。ビデオをエンコードするサンプルアプリケーションは、ffmpeg libavcodec のサンプルページにあります。

score 7 · Accepted Answer

以下のコードのような高速なテスト (テスト済み) では、サイズ変更可能なウィンドウは処理されません。

#include <stdio.h>
FILE *avconv = NULL;
...
/* initialize */
avconv = popen("avconv -y -f rawvideo -s 800x600 -pix_fmt rgb24 -r 25 -i - -vf vflip -an -b:v 1000k test.mp4", "w");
...
/* save */
glReadPixels(0, 0, 800, 600, GL_RGB, GL_UNSIGNED_BYTE, pixels);
if (avconv)
    fwrite(pixels ,800*600*3 , 1, avconv);
...
/* term */
if (avconv)
    pclose(avconv);

score 5 · Accepted Answer

FFmpeg 2.7 で実行可能な mpg の例

説明とスーパーセットの例: How to use GLUT/OpenGL to render to a file?

包含形式を生成するには、https://github.com/FFmpeg/FFmpeg/blob/n3.0/doc/examples/muxing.cを検討してください。

#include <assert.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>

#define GL_GLEXT_PROTOTYPES 1
#include <GL/gl.h>
#include <GL/glu.h>
#include <GL/glut.h>
#include <GL/glext.h>

#include <libavcodec/avcodec.h>
#include <libavutil/imgutils.h>
#include <libavutil/opt.h>
#include <libswscale/swscale.h>

enum Constants { SCREENSHOT_MAX_FILENAME = 256 };
static GLubyte *pixels = NULL;
static GLuint fbo;
static GLuint rbo_color;
static GLuint rbo_depth;
static const unsigned int HEIGHT = 100;
static const unsigned int WIDTH = 100;
static int offscreen = 1;
static unsigned int max_nframes = 100;
static unsigned int nframes = 0;
static unsigned int time0;

/* Model. */
static double angle;
static double delta_angle;

/* Adapted from: https://github.com/cirosantilli/cpp-cheat/blob/19044698f91fefa9cb75328c44f7a487d336b541/ffmpeg/encode.c */
static AVCodecContext *c = NULL;
static AVFrame *frame;
static AVPacket pkt;
static FILE *file;
static struct SwsContext *sws_context = NULL;
static uint8_t *rgb = NULL;

static void ffmpeg_encoder_set_frame_yuv_from_rgb(uint8_t *rgb) {
    const int in_linesize[1] = { 4 * c->width };
    sws_context = sws_getCachedContext(sws_context,
            c->width, c->height, AV_PIX_FMT_RGB32,
            c->width, c->height, AV_PIX_FMT_YUV420P,
            0, NULL, NULL, NULL);
    sws_scale(sws_context, (const uint8_t * const *)&rgb, in_linesize, 0,
            c->height, frame->data, frame->linesize);
}

void ffmpeg_encoder_start(const char *filename, int codec_id, int fps, int width, int height) {
    AVCodec *codec;
    int ret;
    avcodec_register_all();
    codec = avcodec_find_encoder(codec_id);
    if (!codec) {
        fprintf(stderr, "Codec not found\n");
        exit(1);
    }
    c = avcodec_alloc_context3(codec);
    if (!c) {
        fprintf(stderr, "Could not allocate video codec context\n");
        exit(1);
    }
    c->bit_rate = 400000;
    c->width = width;
    c->height = height;
    c->time_base.num = 1;
    c->time_base.den = fps;
    c->gop_size = 10;
    c->max_b_frames = 1;
    c->pix_fmt = AV_PIX_FMT_YUV420P;
    if (codec_id == AV_CODEC_ID_H264)
        av_opt_set(c->priv_data, "preset", "slow", 0);
    if (avcodec_open2(c, codec, NULL) < 0) {
        fprintf(stderr, "Could not open codec\n");
        exit(1);
    }
    file = fopen(filename, "wb");
    if (!file) {
        fprintf(stderr, "Could not open %s\n", filename);
        exit(1);
    }
    frame = av_frame_alloc();
    if (!frame) {
        fprintf(stderr, "Could not allocate video frame\n");
        exit(1);
    }
    frame->format = c->pix_fmt;
    frame->width  = c->width;
    frame->height = c->height;
    ret = av_image_alloc(frame->data, frame->linesize, c->width, c->height, c->pix_fmt, 32);
    if (ret < 0) {
        fprintf(stderr, "Could not allocate raw picture buffer\n");
        exit(1);
    }
}

void ffmpeg_encoder_finish(void) {
    uint8_t endcode[] = { 0, 0, 1, 0xb7 };
    int got_output, ret;
    do {
        fflush(stdout);
        ret = avcodec_encode_video2(c, &pkt, NULL, &got_output);
        if (ret < 0) {
            fprintf(stderr, "Error encoding frame\n");
            exit(1);
        }
        if (got_output) {
            fwrite(pkt.data, 1, pkt.size, file);
            av_packet_unref(&pkt);
        }
    } while (got_output);
    fwrite(endcode, 1, sizeof(endcode), file);
    fclose(file);
    avcodec_close(c);
    av_free(c);
    av_freep(&frame->data[0]);
    av_frame_free(&frame);
}

void ffmpeg_encoder_encode_frame(uint8_t *rgb) {
    int ret, got_output;
    ffmpeg_encoder_set_frame_yuv_from_rgb(rgb);
    av_init_packet(&pkt);
    pkt.data = NULL;
    pkt.size = 0;
    ret = avcodec_encode_video2(c, &pkt, frame, &got_output);
    if (ret < 0) {
        fprintf(stderr, "Error encoding frame\n");
        exit(1);
    }
    if (got_output) {
        fwrite(pkt.data, 1, pkt.size, file);
        av_packet_unref(&pkt);
    }
}

void ffmpeg_encoder_glread_rgb(uint8_t **rgb, GLubyte **pixels, unsigned int width, unsigned int height) {
    size_t i, j, k, cur_gl, cur_rgb, nvals;
    const size_t format_nchannels = 4;
    nvals = format_nchannels * width * height;
    *pixels = realloc(*pixels, nvals * sizeof(GLubyte));
    *rgb = realloc(*rgb, nvals * sizeof(uint8_t));
    /* Get RGBA to align to 32 bits instead of just 24 for RGB. May be faster for FFmpeg. */
    glReadPixels(0, 0, width, height, GL_RGBA, GL_UNSIGNED_BYTE, *pixels);
    for (i = 0; i < height; i++) {
        for (j = 0; j < width; j++) {
            cur_gl  = format_nchannels * (width * (height - i - 1) + j);
            cur_rgb = format_nchannels * (width * i + j);
            for (k = 0; k < format_nchannels; k++)
                (*rgb)[cur_rgb + k] = (*pixels)[cur_gl + k];
        }
    }
}

static int model_init(void) {
    angle = 0;
    delta_angle = 1;
}

static int model_update(void) {
    angle += delta_angle;
    return 0;
}

static int model_finished(void) {
    return nframes >= max_nframes;
}

static void init(void)  {
    int glget;

    if (offscreen) {
        /*  Framebuffer */
        glGenFramebuffers(1, &fbo);
        glBindFramebuffer(GL_FRAMEBUFFER, fbo);

        /* Color renderbuffer. */
        glGenRenderbuffers(1, &rbo_color);
        glBindRenderbuffer(GL_RENDERBUFFER, rbo_color);
        /* Storage must be one of: */
        /* GL_RGBA4, GL_RGB565, GL_RGB5_A1, GL_DEPTH_COMPONENT16, GL_STENCIL_INDEX8. */
        glRenderbufferStorage(GL_RENDERBUFFER, GL_RGB565, WIDTH, HEIGHT);
        glFramebufferRenderbuffer(GL_DRAW_FRAMEBUFFER, GL_COLOR_ATTACHMENT0, GL_RENDERBUFFER, rbo_color);

        /* Depth renderbuffer. */
        glGenRenderbuffers(1, &rbo_depth);
        glBindRenderbuffer(GL_RENDERBUFFER, rbo_depth);
        glRenderbufferStorage(GL_RENDERBUFFER, GL_DEPTH_COMPONENT16, WIDTH, HEIGHT);
        glFramebufferRenderbuffer(GL_DRAW_FRAMEBUFFER, GL_DEPTH_ATTACHMENT, GL_RENDERBUFFER, rbo_depth);

        glReadBuffer(GL_COLOR_ATTACHMENT0);

        /* Sanity check. */
        assert(glCheckFramebufferStatus(GL_FRAMEBUFFER));
        glGetIntegerv(GL_MAX_RENDERBUFFER_SIZE, &glget);
        assert(WIDTH * HEIGHT < (unsigned int)glget);
    } else {
        glReadBuffer(GL_BACK);
    }

    glClearColor(0.0, 0.0, 0.0, 0.0);
    glEnable(GL_DEPTH_TEST);
    glPixelStorei(GL_PACK_ALIGNMENT, 1);
    glViewport(0, 0, WIDTH, HEIGHT);
    glMatrixMode(GL_PROJECTION);
    glLoadIdentity();
    glMatrixMode(GL_MODELVIEW);

    time0 = glutGet(GLUT_ELAPSED_TIME);
    model_init();
    ffmpeg_encoder_start("tmp.mpg", AV_CODEC_ID_MPEG1VIDEO, 25, WIDTH, HEIGHT);
}

static void deinit(void)  {
    printf("FPS = %f\n", 1000.0 * nframes / (double)(glutGet(GLUT_ELAPSED_TIME) - time0));
    free(pixels);
    ffmpeg_encoder_finish();
    free(rgb);
    if (offscreen) {
        glDeleteFramebuffers(1, &fbo);
        glDeleteRenderbuffers(1, &rbo_color);
        glDeleteRenderbuffers(1, &rbo_depth);
    }
}

static void draw_scene(void) {
    glClear(GL_COLOR_BUFFER_BIT | GL_DEPTH_BUFFER_BIT);
    glLoadIdentity();
    glRotatef(angle, 0.0f, 0.0f, -1.0f);
    glBegin(GL_TRIANGLES);
    glColor3f(1.0f, 0.0f, 0.0f);
    glVertex3f( 0.0f,  0.5f, 0.0f);
    glColor3f(0.0f, 1.0f, 0.0f);
    glVertex3f(-0.5f, -0.5f, 0.0f);
    glColor3f(0.0f, 0.0f, 1.0f);
    glVertex3f( 0.5f, -0.5f, 0.0f);
    glEnd();
}

static void display(void) {
    char extension[SCREENSHOT_MAX_FILENAME];
    char filename[SCREENSHOT_MAX_FILENAME];
    draw_scene();
    if (offscreen) {
        glFlush();
    } else {
        glutSwapBuffers();
    }
    frame->pts = nframes;
    ffmpeg_encoder_glread_rgb(&rgb, &pixels, WIDTH, HEIGHT);
    ffmpeg_encoder_encode_frame(rgb);
    nframes++;
    if (model_finished())
        exit(EXIT_SUCCESS);
}

static void idle(void) {
    while (model_update());
    glutPostRedisplay();
}

int main(int argc, char **argv) {
    GLint glut_display;
    glutInit(&argc, argv);
    if (argc > 1)
        offscreen = 0;
    if (offscreen) {
        /* TODO: if we use anything smaller than the window, it only renders a smaller version of things. */
        /*glutInitWindowSize(50, 50);*/
        glutInitWindowSize(WIDTH, HEIGHT);
        glut_display = GLUT_SINGLE;
    } else {
        glutInitWindowSize(WIDTH, HEIGHT);
        glutInitWindowPosition(100, 100);
        glut_display = GLUT_DOUBLE;
    }
    glutInitDisplayMode(glut_display | GLUT_RGBA | GLUT_DEPTH);
    glutCreateWindow(argv[0]);
    if (offscreen) {
        /* TODO: if we hide the window the program blocks. */
        /*glutHideWindow();*/
    }
    init();
    glutDisplayFunc(display);
    glutIdleFunc(idle);
    atexit(deinit);
    glutMainLoop();
    return EXIT_SUCCESS;
}

c++ - openGL コンテキストをビデオ出力として保存する

4 に答える 4

Related

Reference