問題タブ [half-precision-float]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

49 問題

0 投票する

1 に答える

144 参照

cuda - 明示的な組み込み関数を使用しない CUDA 半浮動小数点演算

私は CUDA 11.2 を使用しており、この__half型を使用して 16 ビット浮動小数点値を操作しています。

nvcc コンパイラーが融合乗算加算命令を適切に呼び出さないことに驚いています。

融合乗算加算を発行する代わりに、別個の mul 命令と加算命令を発行します。

これは、--fmad=trueコンパイラオプションを使用しているにもかかわらずです。

明示的なもの__hfma( a,b,c )は次のように出力されます。

明示的な組み込み関数を使用するために 16 ビット浮動小数点の乗加算を利用する唯一の方法はありますか?

2021-01-07T19:46:39.333

1 2 3 4 5 6 7 8 9 10

問題タブ [half-precision-float]

cuda - 明示的な組み込み関数を使用しない CUDA 半浮動小数点演算

Reference