構造にポインターが含まれていない限り、あなたの言うことは絶対に可能です。一般に、主な影響は、既に検討したように、これがメモリ操作の合体に及ぼす影響です。影響の大きさは、メモリ アクセス パターン、構造体のサイズ、実行しているデバイスによって異なります。これをより完全に説明するには、さらに詳細が必要です。
そうは言っても、この方法で構造体を使用して非常にうまくいった例の 1 つは、読み取られる要素がワーク グループ内のすべてのワーク アイテムで同じである場合です。この場合、ハードウェア (nvidia GTX 570) にペナルティはありません。また、場合によっては、シリアル化されるメモリ操作によって追加されたレイテンシが隠される可能性があることも覚えておく価値があります。CUDA の世界では、これは演算強度の高い問題に対して高い占有率を持つことによって達成されます。
最後に、構造体を使用することによるセマンティックの明快さは、それ自体でメリットがあることを指摘しておく価値があります。これは、特定の問題のパフォーマンス コストに対して考慮する必要があります。私のアドバイスは、試してみることです。これらの問題の影響を事前に予測することは非常に困難です。