ドキュメントによると、 にはfma()
関数がありmath.h
ます。それはとてもいいことです。私は FMA がどのように機能し、何に使用するかを知っています。しかし、これが実際にどのように実装されているかはよくわかりません。私は主にx86
とx86_64
アーキテクチャに興味があります。
おそらく IEEE-754 2008 で定義されているように、FMA 用の浮動小数点 (非ベクトル) 命令はありますか?
FMA3 または FMA4 命令は使用されていますか?
精度が信頼されている場合、実際の FMA が使用されていることを確認するための組み込み関数はありますか?