2

NVIDIA GPU に関して、High Performance and Scalable GPU Graph Traversalペーパーの著者は次のように述べています。

1-カーネル呼び出しのシーケンスはバルク同期です。各カーネルには、最初に前の結果の一貫したビューが表示されます。

2-Prefix-sum は一括同期アルゴリズム プリミティブです。

私はこれらの 2 つの点を理解できません (GPU ベースのプレフィックスの合計は知っています)。

4

1 に答える 1