Circle Hough Transform アルゴリズムのパフォーマンスを改善したいと考えているため、CUDA を使用することにしました。私は現在、グローバルメモリでアトミック操作を使用して、遅い可能性があることがわかっている投票を実行しています。ただし、結果をグローバルメモリにコピーして戻すために、投票とそれらの投票の座標位置を共有メモリに保存する方法がわかりません。
CHT の最大のパフォーマンスを達成するためにこれを行うための最善の方法について、誰か提案やアドバイスはありますか?
皆様、お時間を割いていただき、誠にありがとうございました。