compiler-construction - nvcc CUDA コンパイラを使用している場合、セグメンテーション違反の原因として考えられるものは何ですか?

Question

私は CUDA クラスを持っています。それをと呼びましょうA。ヘッダーファイルで定義されています。class のインスタンスを作成するテストカーネルを作成しました。これはA正常にコンパイルされ、期待される結果が生成されます。

さらに、メインの CUDA カーネルも正常にコンパイルされ、期待どおりの結果が得られます。ただし、コードをメインカーネルに追加して class のインスタンスをインスタンス化するAと、nvcc コンパイラがセグメンテーションエラーで失敗します。

アップデート：

明確にするために、セグメンテーション違反は、カーネルの実行時ではなく、コンパイル中に発生します。コンパイルに使用している行は次のとおりです。

`nvcc --cubin -arch compute_20 -code sm_20 -I<My include dir> --keep kernel.cu`

where<My include dir>は、いくつかのユーティリティヘッダーファイルを含むローカルパスへのパスです。

私の質問は、動作を示す最小限の例を分離するのに多くの時間を費やす前に (コードベースが比較的大きいため、簡単ではありません)、誰かが同様の問題に遭遇したことがありますか? カーネルが長すぎるか、使用するレジスタが多すぎる場合、nvcc コンパイラが失敗して停止する可能性はありますか?

レジスタカウントなどの問題がこのようにコンパイラに影響を与える可能性がある場合は、使用するリソースを減らすためにカーネルを実装する方法を再考する必要があります。これは、物事を最小限の例に切り詰めることで、問題が解消される可能性が高いことも意味します。ただし、これが可能ではない場合でも、行き止まりで時間を無駄にしたくはありませんが、最小限の例に切り詰めて、NVIDIA にバグレポートを提出します。

アップデート：

@njuffa の提案に従って、-vフラグを有効にしてコンパイルを再実行しました。出力は次で終了します。

#$ ptxas  -arch=sm_20 -m64 -v  "/path/to/kernel_ptx/kernel.ptx"  -o "kernel.cubin" 
Segmentation fault
# --error 0x8b --

ptxasこれは、ファイルから CUDA バイナリを生成できないプログラムが問題の原因であることを示唆していptxます。

score 3 · Accepted Answer

ptxasこれは、CUDA 5.0アセンブラのある種の本物のバグのようです。これは NVIDIA に報告されており、質問がされてからこの回答が追加されてから 3 年以上の間に修正されたと推測できます。

[この回答はコメントから集められ、未回答の質問リストからこの質問を削除するためにコミュニティ wiki エントリとして追加されました]

compiler-construction - nvcc CUDA コンパイラを使用している場合、セグメンテーション違反の原因として考えられるものは何ですか?

1 に答える 1

Related

Reference