NVIDIA GPU に関して、High Performance and Scalable GPU Graph Traversalペーパーの著者は次のように述べています。
1-カーネル呼び出しのシーケンスはバルク同期です。各カーネルには、最初に前の結果の一貫したビューが表示されます。
2-Prefix-sum は一括同期アルゴリズム プリミティブです。
私はこれらの 2 つの点を理解できません (GPU ベースのプレフィックスの合計は知っています)。
NVIDIA GPU に関して、High Performance and Scalable GPU Graph Traversalペーパーの著者は次のように述べています。
1-カーネル呼び出しのシーケンスはバルク同期です。各カーネルには、最初に前の結果の一貫したビューが表示されます。
2-Prefix-sum は一括同期アルゴリズム プリミティブです。
私はこれらの 2 つの点を理解できません (GPU ベースのプレフィックスの合計は知っています)。