boost::numeric::ublasと同じ方法でベクトルと行列の最も一般的な操作を実装する C++ 固定サイズの行列ライブラリを探していますが、 CUDA カーネル内 で使用されます(したがって、固定サイズでローカル メモリのみを使用し、グローバル メモリ アクセスは使用しません)。
いくつかのホストベースのマトリックス ライブラリを見つけました: boost::numeric::ublas、Eigen、blitzですが、カーネル上の CUDA で使用できる固定サイズのマトリックスがありません。 Eigenには、私が探しているMatrix3fとそれに対応するものがありますが、nvcc でのコンパイルには耐えられません (ただし、その方向でいくつかの進歩があるようですが、こちらを参照してください)。
編集:私はLinuxですべてのことを行っているので、クロスプラットフォームで何かしたいと思っています...