c++ - cusp 継承クラスと *.cu デバイスコードのコンパイル

Question

これが自明でない場合はご容赦ください。私は小さなクラスを持っていcusp::csr_matrix<int,float,cusp::device_memory>ます。

class CuspMatrix 
: public cusp::csr_matrix<int,float,cusp::device_memory>
{
 ...
}

これまでのところ、デバイス用にコンパイルする必要があると思われることは何もしていません。ただし、この特定のクラスで、デバイス上で実行する必要があるメンバー/関数としてコードを作成する予定ですが、正しく理解していれば、cuspすでにこの機能を提供していますか? 例えば：

ValueType v_nrm2 = cusp::blas::nrm2(V);
cusp::transpose(M,M_t);

ノルムの計算または転置は、理想的にはデバイス実行用にコンパイルする必要があります。この場合、それがクラスメソッドの一部である場合、どうすればよいでしょうか?

*.hppクラスのヘッダーファイル全体を作成し、コンパイル*.cu用に追加する必要がありますか? nvcc実際のコードのみを (ヘッダー宣言ではなく) マークして、コンパイル*.cu用に追加しますか? nvccまたは、これは必要ありませんか？

score 2 · Accepted Answer

心に留めておかなければならないことは、cusp はテンプレートライブラリでもある Thrust の上に構築されたテンプレートライブラリであるということです。カスプとスラストのクラスメソッドは両方とも多くのデバイスコードを含んでいるため、それらを継承するとデバイスコードも多く継承されます。

これは、どのようにコードを構造化することを選択しても、「クラシック」CUDA コンパイルでは、クラスのインスタンス化のポイントと、含まれるすべてのカスプおよびスラストテンプレートコードが同じ翻訳単位にある必要があり、フォームで nvcc に提示される必要があることを意味します。デバイスコードのコンパイルが必要であると認識されます (つまり、.cu ファイル内または適切なコンパイラスイッチを使用)。

したがって、派生クラスを定義してインスタンス化するこのシーケンスは次のとおりです。

class CuspMatrix 
: public cusp::csr_matrix<int,float,cusp::device_memory>
{
    ...
}

...

{
    CuspMatrix A;
    ...
}

nvcc でコンパイルする必要があります。

c++ - cusp 継承クラスと *.cu デバイス コードのコンパイル

1 に答える 1

Related

Reference

c++ - cusp 継承クラスと *.cu デバイスコードのコンパイル