LeNet-5 ( paper )の各レイヤーに必要なフロップ数を計算したいと思います。一部の論文では、合計で他のアーキテクチャの FLOP が示されています ( 1、2、3 )。しかし、これらの論文では、FLOP の数を計算する方法について詳しく説明されておらず、非線形活性化関数に必要な FLOP の数がわかりません。 . たとえば、計算にはいくつの FLOP が必要tanh(x)
ですか?
これは実装であり、おそらくハードウェア固有でもあると思います。しかし、私は主に桁違いに興味があります。10 FLOPS について話しているのでしょうか。100 FLOPS? 1000 FLOPS? したがって、答えに必要なアーキテクチャ/実装を選択してください。(Intel i5 / nvidia GPU / Tensorflowなどの「一般的な」セットアップに近い回答をいただければ幸いです)