プログラムの最も内側のループに次のコードがあります
struct V {
float val [200]; // 0 <= val[i] <= 1
};
V a[600];
V b[250];
V c[250];
V d[350];
V e[350];
// ... init values in a,b,c,d,e ...
int findmax(int ai, int bi, int ci, int di, int ei) {
float best_val = 0.0;
int best_ii = -1;
for (int ii = 0; ii < 200; ii++) {
float act_val =
a[ai].val[ii] +
b[bi].val[ii] +
c[ci].val[ii] +
d[ci].val[ii] +
e[ci].val[ii];
if (act_val > best_val) {
best_val = act_val;
best_ii = ii;
}
}
return best_ii;
}
それが巧妙なアルゴリズム (しかし、これが最も興味深い) であろうと、C++ のトリック、組み込み関数、またはアセンブラーであろうと、私は気にしません。しかし、findmax 関数をより効率的にする必要があります。
よろしくお願いします。
編集: ブランチが最も遅い操作のようです(予測ミス?)。