パフォーマンスを改善しようとしている非常に単純なプログラムがあります。私が知っている 1 つの方法は、SSE3 を利用することです (私が作業しているマシンはこれをサポートしているため) が、これを行う方法がまったくわかりません。コード スニペット (c++) は次のとおりです。
int sum1, sum2, sum3, sum4;
for (int i=0; i<length; i+=4) {
for (int j=0; j<length; j+=4) {
sum1 = sum1 + input->value[i][j];
sum2 = sum2 + input->value[i+1][j+1];
sum3 = sum3 + input->value[i+2][j+3];
sum4 = sum4 + input->value[i+3][j+4];
{
}
私はこれについて少し読んで、その考えを理解しましたが、これを実装する方法がまったくわかりません。誰か助けてくれませんか?特に私の単純なプログラムの場合、これはかなり単純だと思いますが、開始するのが最も難しい場合があります。
ありがとう!