問題タブ [half-precision-float]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

49 問題

0 投票する

0 に答える

76 参照

opencl - OpenCL 1.2 を使用した NVIDIA Ampere 世代の GPU で半精度浮動小数点がサポートされているかサポートされていないか

float4 要素を使用して OpenCL で read_imagef および write_imagef 操作を行うカーネルを実装しましたが、正常に動作します。

そこで、半精度浮動小数点要素を使って実装してみました。この場合、「ptxas fatal: 関数 read_imageh のアドレスを取得できません」または halfn 変数にアクセスする際の他の同様のエラーメッセージを示すビルドエラーが発生しました。

CL_DEVICE_PREFERRED_VECTOR_WIDTH_HALF 引数を指定して clGetDeviceInfo をチェックすると、サポートされていないことを意味する 0 が返されました。NVIDIA Ampere アーキテクチャは半精度浮動小数点演算をサポートしているため、これは当てはまらないと思います。

使用するデバイスは、OpenCL バージョン 1.2 を搭載した NVIDIA GeForce RTX 3060 Ti です。

2021-07-09T12:04:08.587

0 投票する

1 に答える

264 参照

tensorflow - トレーニング済みモデルに半精度 (BFLOAT16 と FLOAT16) を選択する方法は?

推論モデルに最適な精度をどのように決定しますか? BF16 と F16 はどちらも 2 バイトを使用しますが、小数部と指数部に異なる数のビットを使用します。

範囲は異なりますが、なぜある人が他の人よりも選ばれたのかを理解しようとしています.

ありがとうございました

tensorflow machine-learning deep-learning pytorch half-precision-float

2021-09-30T23:58:24.197

1 2 3 4 5 6 7 8 9 10

問題タブ [half-precision-float]

opencl - OpenCL 1.2 を使用した NVIDIA Ampere 世代の GPU で半精度浮動小数点がサポートされているかサポートされていないか

tensorflow - トレーニング済みモデルに半精度 (BFLOAT16 と FLOAT16) を選択する方法は?

Reference