SIMD/Intel SSE を使用して、行列の乗算を最適化する必要があります。与えられたコード例は次のようになります。
*x = (float*)memalign(16, size * sizeof(float));
ただし、私は C++ を使用しており、[found that][1]
代わりにmalloc
(SIMD を実行する前に) を使用する必要がありますnew
。今、私は SIMD/SSE を介してさらに最適化しているので、アラインされたメモリが必要なので、質問は: 必要ですかmemalign
/_aligned_malloc
または私の配列は次のように宣言されていますか?
static float m1[SIZE][SIZE];
すでに整列?(SIZE
はintです)