2 つの異なる openCl カーネルを作成し、nvidia プロファイラーを使用してそれらに関する情報を取得したところ、どちらもワークアイテムごとに 63 個のレジスタを使用していることがわかりました。
この数値を下げるために考えられるすべてのことを試しました (int を ushort に置き換え、{} 内で変数を宣言して、コンパイラーがそれらを取り除くことができる時期を示すようにしました) が、この 63 を変更することは不可能のようです!
それから、彼が書いたカーネルについて別の質問を見つけました...これもまた 63 個のレジスタを使用します。
もちろん、これは純粋な偶然かもしれませんが、背後に理由があるのかもしれません...使用されている特定の機能、ハードウェアの制限?誰か知っていますか?