私が開発しているグラフィックエンジンは、頂点の行列変換である主要なボトルネックを開発しました(静的な頂点はほとんどありません)。これまで、CPUを使用して頂点を変換し、フレームごとに頂点バッファーを更新してきました(データのコピー自体は少しボトルネックですが、これまでのところ管理可能です)。
したがって、メッシュバッファーをGPU内に保持できれば、そこで頂点を変換し、変換された頂点のセットを他の処理のためにメインメモリに戻すことができると考えていました(後続の処理には、GPUシェーダーよりも少し多くの相互接続が必要です)許可する)。は、現在のコードのボトルネックを解消する可能性があります。
それを行う方法に関するヒントはありますか?ありがとう。