私は作業中の検出および追跡プロセス (行と列のピクセル画像) を持っていますが、これは完全に再現性のある結果を提供しません。これは、atomicAdd を使用すると、重心やその他の計算で丸め誤差につながるさまざまな順序でデータ ポイントが蓄積される可能性があるためです。統計を追跡します。
基本的に、atomicAdd の衝突はほとんどないため、ほとんどの結果は同じです。ただし、検証と検証のために、atomicAdd がこれらの衝突データポイントを一貫した順序で追加できるようにする必要があります。たとえば、スレッド 3 がスレッド 10 を打ち負かし、両方がatomicAdd を使用して行 N にピクセルを追加したい場合などです。処理中です。
スレッドの順序でatomicAddを決定論的にできるメカニズムはありますか、それとも何か見逃していますか?