for (n = 0; n < L_SUBFR; n++)
{
s = 0;
for (i = 0; i <= n; i++)
{
s += exc[i] * h1[n - i];
}
y1[n] = s;
}
最適化されたバージョン:
for (n = L_SUBFR; n != 0; n--)
{
for (i = n; i != 0; i--)
{
y1[n] = y1[n] + exc[i] * h1[n - i];
}
}
AMD opteron 6274
コンパイル後に両方のコードをビット マシンでgcc 4.4.6.
実行しましたが、速度や実行時間の向上は見られません。
(1) 上記のコードをさらに最適化する方法はありますか?
(2)なぜ私が利益を見ることができないのか教えてもらえますか?