レイトレーシング衝突テスト カーネル (Cuda、Opencl) で GPU コンピューティング用のカスタム分岐予測アルゴリズムを試した人はいますか?
低深度(2-5)のパフォーマンスについても心配する必要がありますか?
例:
trace for the first group of rays
check for previous ray depth predictor, if zero, guess zero.
if gt one, guess d>=1
go one level deeper in tracing kernel.(with pseudo stack & recursivity)
recursively repeat
go out of one depth after saving guess state
recursively go out of depths.
これはハードウェア レベルの予測を超えることができますか? これにより、合計トレース時間を改善できますか?
この疑似コードの「if」文には、「if」を含めないでください。したがって、予測値に応じてゼロまたは実際の値を計算するだけです。
ありがとう。