0

フラグメントシェーダーを介して独自のカスタム glBlendFunc を実行しようとしていますが、正確なブレンド機能を実行する場合でも、私のソリューションはネイティブの glBlendFunc よりもはるかに遅くなります。

より効率的な方法でこれを行う方法について何か提案があるかどうか疑問に思っていました。

私のソリューションは次のように機能します。

void draw(fbo fbos[2], render_item item)
{
   // fbos[0] is the render target
   // fbos[1] is the previous render target used to read "background" to blend against in shader
   // Both fbos have exactly the same content, however they need to be different since we can't both read and write to the same texture. The texture we render to needs to have the entire content since we might not draw geometry everywhere.

   fbos[0]->attach(); // Attach fbo
   fbos[1]->bind(1); // Bind as texture 1

   render(item);

   glCopyTexSubImage2D(...); // copy from fbos[0] to fbos[1], fbos[1] == fbos[0]
} 

フラグメント.glsl

vec4 blend_color(vec4 fore) 
{   
    vec4 back = texture2D(background, gl_TexCoord[1].st); // background is read from texture "1"
    return vec4(mix(back.rgb, fore.rgb, fore.a), back.a + fore.a);  
}
4

2 に答える 2

3

FBO ベースのブレンディングのパフォーマンスを向上させる最善の策はNV_texture_barrierです。その名前にもかかわらず、AMDもそれを実装しているので、Radeon HDクラスのカードに固執するなら、それを利用できるはずです.

基本的に、FBO バインディングやテクスチャ アタッチ操作などの重い操作なしでピンポンできます。仕様の下部には、一般的なアルゴリズムを示すセクションがあります。

別の代替手段はEXT_shader_image_load_storeです。これには、DX11/GL 4.x クラスのハードウェアが必要です。OpenGL 4.2 は最近、これをARB_shader_image_load_storeでコアに昇格させました。

これでも、ダーシーが言ったように、通常のブレンドに勝るものはありません. シェーダーがアクセスできない特別なハードウェア構造を使用します (シェーダーが実行された後に発生するため)。他の方法では絶対に達成できない効果がある場合にのみ、プログラムによるブレンディングを行う必要があります。

于 2011-08-14T03:00:04.330 に答える
2

ブレンディング操作が GPU ハードウェアに直接組み込まれているため、はるかに効率的であり、おそらく速度で勝ることはありません。そうは言っても、深度テスト、バック フェース カリング、ハードウェア ブレンディング、およびその他の不要な操作がオフになっていることを確認してください。大きく変わるとは言えませんが、少しは変わるかもしれません。

于 2011-08-14T02:44:20.633 に答える