グラフィック用のSIMDライブラリに焦点を当てた小さな(4x4)行列演算を探しています。単精度のものはたくさんありますが、単精度と倍精度の両方をサポートする必要があります。
IntelのIPPMXライブラリを見てきましたが、ソース付きのものがいいと思います。私はこれらの特定の操作のSSE3+実装に非常に興味があります:
- Mat4 * Mat4
- Mat4 * Vec4
- Mat4*Mat4の配列
- Mat4*Vec4の配列
- Mat4反転(持っているといい)
編集:「時期尚早の最適化」の答えはありません。小さな行列を扱ったことがある人なら誰でも、GCCがこれらをベクトル化せず、手動で最適化された組み込み関数やASMもベクトル化しないことを知っています。そしてこの場合、それは重要です、さもなければ私は尋ねないでしょう。