GPGPU コンピューティングに半精度を使用しようとしています。私はクリアする必要がある混乱があります
これらすべてへの参照を同時に見つけることができました。
テクスチャ フォーマットとしてサポートされる半浮動小数点データ タイプ、テクスチャ ハードウェアによる半精度から浮動小数点への自動変換、デバイスでのみサポートされるfloattohalfおよびhalftofloat変換関数、半精度値のunsigned shortフォーマットでの格納。
したがって、これらすべてが理にかなっているために、私はこれらの推論を行いました。
CUDA は、半精度を処理する 2 つの方法をサポートしています。
浮動小数点数をグローバル メモリに格納します。操作を実行する前に、 halftofloatを介してそれらを半分に変換し、 unsigned short でグローバル メモリに格納し、 halftofloat を介して float に再変換します。
(テクスチャ メモリはデバイスからの読み取り専用であるため) 半精度の数値をホストに unsigned short で格納し、それらをホスト コードからテクスチャ メモリに格納し、組み込みの TEX 関数を介して読み取り、操作を実行します (float に変換する必要はありません)。 .
私が間違っている場合は修正してください。