gccには#pragma vector aligned、Intelコンパイラと同様のメモリアライメントプラグマがありますか?整列されたロード/ストア命令を使用して特定のループを最適化するようにコンパイラーに指示したいと思います。混乱を避けるために、これは構造体のパッキングに関するものではありません。
例えば:
#if defined (__INTEL_COMPILER)
#pragma vector aligned
#endif
for (int a = 0; a < int(N); ++a) {
q10 += Ix(a,0,0)*Iy(a,1,1)*Iz(a,0,0);
q11 += Ix(a,0,0)*Iy(a,0,1)*Iz(a,1,0);
q12 += Ix(a,0,0)*Iy(a,0,0)*Iz(a,0,1);
q13 += Ix(a,1,0)*Iy(a,0,0)*Iz(a,0,1);
q14 += Ix(a,0,0)*Iy(a,1,0)*Iz(a,0,1);
q15 += Ix(a,0,0)*Iy(a,0,0)*Iz(a,1,1);
}
ありがとう