現時点では、ユニオンを介してフロート値にアクセスしています
typedef union
{
float v[4];
_mm128 m;
}SSEFloat;
しかし、このリンクでは、パフォーマンスが失われていると聞きました。GCC 4 でパフォーマンスが低下することはありますか? フロートを揃える必要がありますか? ユニオンでも?または、このような値を設定するのは正しいですか
SSEFloat a;
float tmp = 10.0;
a.m = _mm_load1_ps( &tmp );
現時点では、Intel SSE Intrinsic Documentation も見つかりませんでした :( 「小さな」リストはありますか - 速度の最適化について知っておくべきことは何ですか?