0

GPGPU コンピューティングに半精度を使用しようとしています。私はクリアする必要がある混乱があります

これらすべてへの参照を同時に見つけることができました。

テクスチャ フォーマットとしてサポートされる半浮動小数点データ タイプ、テクスチャ ハードウェアによる半精度から浮動小数点への自動変換、デバイスでのみサポートされるfloattohalfおよびhalftofloat変換関数、半精度値のunsigned shortフォーマットでの格納。

したがって、これらすべてが理にかなっているために、私はこれらの推論を行いました。

CUDA は、半精度を処理する 2 つの方法をサポートしています。

  1. 浮動小数点数をグローバル メモリに格納します。操作を実行する前に、 halftofloatを介してそれらを半分に変換し、 unsigned short でグローバル メモリに格納し、 halftofloat を介して float に再変換します。

  2. (テクスチャ メモリはデバイスからの読み取り専用であるため) 半精度の数値をホストに unsigned short で格納し、それらをホスト コードからテクスチャ メモリに格納し、組み込みの TEX 関数を介して読み取り、操作を実行します (float に変換する必要はありません)。 .

私が間違っている場合は修正してください。

4

0 に答える 0