9

2Dゲームエンジン用にキャンバスベースのレンダリングを書き直そうとしています。私は順調に進歩しており、スケーリング、回転、ブレンドを備えたテクスチャをwebglコンテキストにうまくレンダリングできます。しかし、私のパフォーマンスは最悪です。私のテストラップトップでは、一度に1,000個のエンティティが画面に表示されるバニラ2Dキャンバスで30fpsを取得できます。WebGLでは、画面に500個のエンティティがある30fpsを取得します。状況は逆になると思います!

Float32Array私は、犯人が私が投げかけているこのすべての緩衝ゴミであるというこっそりの疑いを持っています。これが私のレンダリングコードです:

// boilerplate code and obj coordinates

// grab gl context
var canvas = sys.canvas;
var gl = sys.webgl;
var program = sys.glProgram;

// width and height
var scale = sys.scale;
var tileWidthScaled = Math.floor(tileWidth * scale);
var tileHeightScaled = Math.floor(tileHeight * scale);
var normalizedWidth = tileWidthScaled / this.width;
var normalizedHeight = tileHeightScaled / this.height;

var worldX = targetX * scale;
var worldY = targetY * scale;

this.bindGLBuffer(gl, this.vertexBuffer, sys.glWorldLocation);
this.bufferGLRectangle(gl, worldX, worldY, tileWidthScaled, tileHeightScaled);

gl.activeTexture(gl.TEXTURE0);
gl.bindTexture(gl.TEXTURE_2D, this.texture);

var frameX = (Math.floor(tile * tileWidth) % this.width) * scale;
var frameY = (Math.floor(tile * tileWidth / this.width) * tileHeight) * scale;

// fragment (texture) shader
this.bindGLBuffer(gl, this.textureBuffer, sys.glTextureLocation);
this.bufferGLRectangle(gl, frameX, frameY, normalizedWidth, normalizedHeight);

gl.drawArrays(gl.TRIANGLES, 0, 6);

bufferGLRectangle: function (gl, x, y, width, height) {
    var left = x;
    var right = left + width;
    var top = y;
    var bottom = top + height;
    gl.bufferData(gl.ARRAY_BUFFER, new Float32Array([
        left, top,
        right, top,
        left, bottom,
        left, bottom,
        right, top,
        right, bottom
    ]), gl.STATIC_DRAW);
},

bindGLBuffer: function (gl, buffer, location) {
    gl.bindBuffer(gl.ARRAY_BUFFER, buffer);
    gl.vertexAttribPointer(location, 2, gl.FLOAT, false, 0, 0);
},

そして、これが私の単純なテストシェーダーです(これらにはブレンド、スケーリング、回転がありません):

// fragment (texture) shader
precision mediump float;
uniform sampler2D image;
varying vec2 texturePosition;

void main() {
    gl_FragColor = texture2D(image, texturePosition);
}

// vertex shader
attribute vec2 worldPosition;
attribute vec2 vertexPosition;

uniform vec2 canvasResolution;
varying vec2 texturePosition;

void main() {
    vec2 zeroToOne = worldPosition / canvasResolution;
    vec2 zeroToTwo = zeroToOne * 2.0;
    vec2 clipSpace = zeroToTwo - 1.0;

    gl_Position = vec4(clipSpace * vec2(1, -1), 0, 1);
    texturePosition = vertexPosition;
}

より良いパフォーマンスを得る方法について何かアイデアはありますか?drawArrayをバッチ処理する方法はありますか?バッファのゴミを減らす方法はありますか?

ありがとう!

4

2 に答える 2

8

ここで確認できる2つの大きな問題があり、パフォーマンスに悪影響を及ぼします。

あなたは多くの一時的なFloat32Arraysを作成していますが、それらは現在構築するのに費用がかかります(それは将来良くなるはずです)。この場合、単一の配列を作成し、毎回次のように頂点を設定する方がはるかに優れています。

verts[0] = left; verts[1] = top;
verts[2] = right; verts[3] = top;
// etc... 
gl.bufferData(gl.ARRAY_BUFFER, verts, gl.STATIC_DRAW);

ただし、はるかに大きな問題は、一度に1つのクワッドしか描画しないことです。3D APIは、これを効率的に行うように設計されていません。あなたがしたいのは、あなたが行う各drawArrays / drawElements呼び出しに、できるだけ多くの三角形を押し込んでみることです。

これを行うにはいくつかの方法があります。最も簡単な方法は、同じテクスチャを共有するクワッドをできるだけ多くバッファに入れて、それらをすべて一度に描画することです。擬似コードの場合:

var MAX_QUADS_PER_BATCH = 100;
var VERTS_PER_QUAD = 6;
var FLOATS_PER_VERT = 2;
var verts = new Float32Array(MAX_QUADS_PER_BATCH * VERTS_PER_QUAD * FLOATS_PER_VERT);

var quadCount = 0;
function addQuad(left, top, bottom, right) {
    var offset = quadCount * VERTS_PER_QUAD * FLOATS_PER_VERT;

    verts[offset] = left; verts[offset+1] = top;
    verts[offset+2] = right; verts[offset+3] = top;
    // etc...

    quadCount++;

    if(quadCount == MAX_QUADS_PER_BATCH) {
        flushQuads();
    }
}

function flushQuads() {
    gl.bindBuffer(gl.ARRAY_BUFFER, vertsBuffer);
    gl.bufferData(gl.ARRAY_BUFFER, verts, gl.STATIC_DRAW); // Copy the buffer we've been building to the GPU.

    // Make sure vertexAttribPointers are set, etc...

    gl.drawArrays(gl.TRIANGLES, 0, quadCount + VERTS_PER_QUAD);
}

// In your render loop

for(sprite in spriteTypes) {
    gl.bindTexture(gl.TEXTURE_2D, sprite.texture);

    for(instance in sprite.instances) {
        addQuad(instance.left, instance.top, instance.right, instance.bottom);  
    }

    flushQuads();
}

これは過度に単純化されており、さらにバッチ処理する方法がありますが、パフォーマンスを向上させるために呼び出しのバッチ処理を開始する方法がわかるといいのですが。

于 2013-03-23T16:52:33.737 に答える
2

WebGL Inspectorを使用している場合、不要なGL命令を実行すると、トレースに表示されます(明るい黄色の背景でマークされています)。これにより、レンダリングを最適化する方法がわかる場合があります。

一般的に、描画呼び出しを並べ替えて、すべて同じプログラム、属性、テクスチャ、ユニフォームの順に使用するようにします。このようにして、GL命令(およびJS命令)をできるだけ少なくします。

于 2013-03-23T15:37:48.037 に答える