明示的なキャストを行う方法が思いつきません。
ただし、memcpy することもできます。memcpy の呼び出しは、あなたが思っているほど愚かではありません。コンパイラは、多くの場合、2 ビットのデータが実際には同じものを表し、memcpy が固定サイズであり、実際のコピーを最適化します。
あなたがやっているマトリックスほど大きなもので試したことは一度もないと言わなければなりませんが、なぜうまくいかないのかわかりません。
編集:実際、試してみようと思いました。次のコードを書きました。
void transpose_3x3( double (*x)[3][3] )
{
const double t01 = (*x)[0][1];
const double t02 = (*x)[0][2];
const double t12 = (*x)[1][2];
(*x)[0][1] = (*x)[1][0];
(*x)[0][2] = (*x)[2][0];
(*x)[1][0] = t01;
(*x)[1][2] = (*x)[2][1];
(*x)[2][0] = t02;
(*x)[2][1] = t12;
}
void foo()
{
double x[9] = { 1.0f, 2.0f, 3.0f,
4.0f, 5.0f, 6.0f,
7.0f, 8.0f, 9.0f };
double y[3][3];
memcpy( y, x, sizeof( double ) * 9 );
transpose_3x3( &y );
printf( "%f, %f, %f\n", y[0][0], y[0][1], y[0][2] );
printf( "%f, %f, %f\n", y[1][0], y[1][1], y[1][2] );
printf( "%f, %f, %f\n", y[2][0], y[2][1], y[2][2] );
}
VS2010でリリースモードでビルドしました。
結果のアセンブリは次のとおりです。
void foo()
{
00E11000 push ebp
00E11001 mov ebp,esp
00E11003 and esp,0FFFFFFC0h
00E11006 sub esp,0B8h
double x[9] = { 1.0f, 2.0f, 3.0f,
00E1100C fld1
00E1100E push esi
00E1100F fstp qword ptr [esp+2Ch]
00E11013 push edi
00E11014 fld qword ptr [__real@4000000000000000 (0E12138h)]
4.0f, 5.0f, 6.0f,
7.0f, 8.0f, 9.0f };
double y[3][3];
memcpy( y, x, sizeof( double ) * 9 );
transpose_3x3( &y );
printf( "%f, %f, %f\n", y[0][0], y[0][1], y[0][2] );
00E1101A sub esp,18h
00E1101D fstp qword ptr [esp+50h]
00E11021 mov ecx,12h
00E11026 fld qword ptr [__real@4008000000000000 (0E12130h)]
00E1102C lea esi,[esp+48h]
00E11030 fstp qword ptr [esp+58h]
00E11034 lea edi,[esp+90h]
00E1103B fld qword ptr [__real@4010000000000000 (0E12128h)]
00E11041 fst qword ptr [esp+60h]
00E11045 fld qword ptr [__real@4014000000000000 (0E12120h)]
00E1104B fstp qword ptr [esp+68h]
00E1104F fld qword ptr [__real@4018000000000000 (0E12118h)]
00E11055 fstp qword ptr [esp+70h]
00E11059 fld qword ptr [__real@401c000000000000 (0E12110h)]
00E1105F fst qword ptr [esp+78h]
00E11063 fld qword ptr [__real@4020000000000000 (0E12108h)]
00E11069 fstp qword ptr [esp+80h]
00E11070 fld qword ptr [__real@4022000000000000 (0E12100h)]
00E11076 fstp qword ptr [esp+88h]
00E1107D rep movs dword ptr es:[edi],dword ptr [esi]
00E1107F fstp qword ptr [esp+10h]
00E11083 fstp qword ptr [esp+8]
00E11087 fld qword ptr [esp+90h]
00E1108E fstp qword ptr [esp]
00E11091 mov esi,dword ptr [__imp__printf (0E120A0h)]
00E11097 push offset string "%f, %f, %f\n" (0E120F4h)
00E1109C call esi
printf( "%f, %f, %f\n", y[1][0], y[1][1], y[1][2] );
00E1109E add esp,4
00E110A1 fld qword ptr [esp+0C8h]
00E110A8 fstp qword ptr [esp+10h]
00E110AC fld qword ptr [esp+0B0h]
00E110B3 fstp qword ptr [esp+8]
00E110B7 fld qword ptr [__real@4000000000000000 (0E12138h)]
00E110BD fstp qword ptr [esp]
00E110C0 push offset string "%f, %f, %f\n" (0E120F4h)
00E110C5 call esi
printf( "%f, %f, %f\n", y[2][0], y[2][1], y[2][2] );
00E110C7 fld qword ptr [esp+0D4h]
00E110CE add esp,4
00E110D1 fstp qword ptr [esp+10h]
00E110D5 fld qword ptr [__real@4018000000000000 (0E12118h)]
00E110DB fstp qword ptr [esp+8]
00E110DF fld qword ptr [__real@4008000000000000 (0E12130h)]
00E110E5 fstp qword ptr [esp]
00E110E8 push offset string "%f, %f, %f\n" (0E120F4h)
00E110ED call esi
00E110EF add esp,1Ch
}
memcpy がないことに注意してください。実際には、行列を x から y に手動でコピーし、それを転置して出力するだけです。基本的に、コンパイラが物事を最適化するために何をするかを見るのは興味深い...
編集2:もちろん、水田の優れた反応を見た後、もう少し考えてみると、物事を直接ケースに入れることができると思います
transpose_3x3( (double (*)[3][3])&x );
memcpy またはユニオンなしで動作するもの:D