parallel-processing - CUDA / OpenCL での深さ優先検索

Question

私はMPIで並列深さ優先検索アルゴリズムを実装する途中で、CUDA / OpenCLでもそれをやろうと考えています.楽しみ/好奇心から。アルゴリズムは単純ですが、自明ではありません。C のシングルコアバージョンは、約 200 行のコードです。

GPGPU はこの種の問題にどのくらい適していますか?

score 6 · Accepted Answer

ツリー検索操作は、CUDA で実装するにはそれほど単純ではありません。みたいな紙もあります

そして、別のかなり単純な実装 (私の意見では、大規模な並列化された実装ではありません)

難しいのは、ツリーの操作には一般に意思決定が含まれ、決定に従って異なる分岐が行われるという事実から来ています。そのため、オーバーラップせずに操作を大規模に並列化し、冗長な操作を作成することは非常に困難です。

スタックとキューの実装を使用してツリーをトラバースするアプローチがいくつかあります。

ここで同様の質問を見つけることができます: Error: BFS on CUDA Synchronization

1 に答える 1