私はいくつかの統計計算を行っています。高速にする必要があるので、SSEを使用するようにほとんどを書き直しました。私はそれにかなり慣れていないので、ここでの正しいアプローチは何であるか疑問に思いました:
私の知る限り、SSEにはlog2またはln関数はありません。少なくとも、私が使用しているハードウェアでサポートされている最新バージョンである4.1まではありません。
次の方が良いですか:
- 4つのフロートを抽出し、それらに対してFPU計算を実行して、エントロピーを決定します-これらの値をSSEレジスタにロードする必要はなく、合計して別のフロートにするだけです。
- log2を実行するSSEの関数を見つける