1

Eigenライブラリを使用する私のプログラムでは、2Dベクトルを操作する必要があります。私の内側のループには、次の関数があります。

static inline double eval(double x, double y, double xi, double yi)
{
    const double invlen2  = 1/(x*x + y*y);
    const double invlen4 = invlen2*invlen2;
    const double invlen6 = invlen4*invlen2;

    const double x2  = x*x,   y2  = y*y;
    const double x3  = x2*x,  y3  = y2*y;
    const double xi2 = xi*xi, yi2 = yi*yi;

    return x*invlen2 + invlen4*(x2*xi + 2*x*y*yi - xi*y2)
    + invlen6*(x3*xi2 + 3*x*y2*yi2 + 6*x2*y*xi*yi - 3*x*xi2*y2 - 2*y3*xi*yi - x3*yi2);
}

void f(Vector2d& out, const Vector2d& R, const Vector2d& r)
{
    out.x() = eval(R.x(), R.y(), r.x(), r.y());
    out.y() = eval(R.y(), R.x(), r.y(), r.x());
}

x()この式は厄介ですが、とy()計算の両方が同じパスをたどるため、ベクトル化の主要な候補のように見えます。私の質問は、手動でアセンブリにドロップダウンする必要なしに、Eigenでそれを行う方法です。

4

1 に答える 1

1

この答えはEigenとは関係ありませんが、手動でアセンブリにドロップダウンするとおっしゃっていたので、これを追加します。

コードをベクトル化するためにアセンブリを使用する必要はありません。アセンブリなしで手動でベクトル化できるコンパイラ組み込み関数があります。

http://software.intel.com/sites/products/documentation/studio/composer/en-us/2011/compiler_c/intref_cls/common/intref_overview.htm#intref_overview

つまり、Eigenはすでにベクトル化を内部でサポートしているようですが、あなたの例では適用できないようです。だから私はあなたがそれを手動でやりたい理由を見ることができます。

于 2011-10-09T02:11:23.310 に答える