PADDD(つまり、_mm_add_epi32組み込み)などのSSE2命令を使用する場合、いずれかの操作がオーバーフローしたかどうかを確認する方法はありますか?
オーバーフロー後にMXCSR制御レジスタのフラグが設定されるのではないかと思いましたが、そうはいきません。たとえば、_mm_getcsr()以下の両方の場合で同じ値を出力します(8064)。
#include <iostream>
#include <emmintrin.h>
using namespace std;
void main()
{
    __m128i a = _mm_set_epi32(1, 0, 0, 0);
    __m128i b = _mm_add_epi32(a, a);
    cout << "MXCSR:  " << _mm_getcsr() << endl;
    cout << "Result: " << b.m128i_i32[3] << endl;
    __m128i c = _mm_set_epi32((1<<31)-1, 3, 2, 1);
    __m128i d = _mm_add_epi32(c, c);
    cout << "MXCSR:  " << _mm_getcsr() << endl;
    cout << "Result: " << d.m128i_i32[3] << endl;
}
SSE2のオーバーフローをチェックする他の方法はありますか?