コードを考えると:
for (int i = 0; i < n; ++i)
{
A(i) ;
B(i) ;
C(i) ;
}
そして最適化バージョン:
for (int i = 0; i < (n - 2); i+=3)
{
A(i)
A(i+1)
A(i+2)
B(i)
B(i+1)
B(i+2)
C(i)
C(i+1)
C(i+2)
}
よくわからないことがあります: どちらが良いですか? 他のバージョンを使用すると、これ以上高速に動作するものは見当たりません。ここで何か不足していますか?
私が見るのは、各命令が前の命令に依存していることです。つまり、次の命令を開始するには、前の命令が終了するのを待つ必要があります...
ありがとう