PADDD
(つまり、_mm_add_epi32
組み込み)などのSSE2命令を使用する場合、いずれかの操作がオーバーフローしたかどうかを確認する方法はありますか?
オーバーフロー後にMXCSR制御レジスタのフラグが設定されるのではないかと思いましたが、そうはいきません。たとえば、_mm_getcsr()
以下の両方の場合で同じ値を出力します(8064)。
#include <iostream>
#include <emmintrin.h>
using namespace std;
void main()
{
__m128i a = _mm_set_epi32(1, 0, 0, 0);
__m128i b = _mm_add_epi32(a, a);
cout << "MXCSR: " << _mm_getcsr() << endl;
cout << "Result: " << b.m128i_i32[3] << endl;
__m128i c = _mm_set_epi32((1<<31)-1, 3, 2, 1);
__m128i d = _mm_add_epi32(c, c);
cout << "MXCSR: " << _mm_getcsr() << endl;
cout << "Result: " << d.m128i_i32[3] << endl;
}
SSE2のオーバーフローをチェックする他の方法はありますか?