CUDA または OpenCL を使用したプレフィックス サム/スキャン アルゴリズムのグローバル メモリ実装を探していました。すべての実装は、ローカル メモリを使用して行われています。誰かがアルゴリズムと私がどのように進めるべきかについて私を助けることができますか?
CUDA または OpenCL を使用したプレフィックス サム/スキャン アルゴリズムのグローバル メモリ実装を探していました。すべての実装は、ローカル メモリを使用して行われています。誰かがアルゴリズムと私がどのように進めるべきかについて私を助けることができますか?