数週間前、私は行列乗算のパフォーマンスについて質問しました。
プログラムのパフォーマンスを向上させるには、独自のクラスではなく、特殊な行列クラスを使用する必要があると言われました。
StackOverflow ユーザーの推奨事項:
- ユーブラス
- 固有値
- ブラス
最初は uBLAS を使用したかったのですが、ドキュメントを読んでいると、このライブラリは行列 - 行列の乗算をサポートしていないことがわかりました。
結局、EIGEN ライブラリを使用することにしました。そのため、マトリックス クラスを次のEigen::MatrixXd
ように変更しましたが、アプリケーションの動作が以前よりもさらに遅くなることが判明しました。EIGEN を使用する前の時間は 68 秒で、マトリックス クラスを EIGEN マトリックス プログラムに交換した後は 87 秒間実行されました。
最も時間がかかるプログラムの部分はそのように見えます
TemplateClusterBase* TemplateClusterBase::TransformTemplateOne( vector<Eigen::MatrixXd*>& pointVector, Eigen::MatrixXd& rotation ,Eigen::MatrixXd& scale,Eigen::MatrixXd& translation )
{
for (int i=0;i<pointVector.size();i++ )
{
//Eigen::MatrixXd outcome =
Eigen::MatrixXd outcome = (rotation*scale)* (*pointVector[i]) + translation;
//delete prototypePointVector[i]; // ((rotation*scale)* (*prototypePointVector[i]) + translation).ConvertToPoint();
MatrixHelper::SetX(*prototypePointVector[i],MatrixHelper::GetX(outcome));
MatrixHelper::SetY(*prototypePointVector[i],MatrixHelper::GetY(outcome));
//assosiatedPointIndexVector[i] = prototypePointVector[i]->associatedTemplateIndex = i;
}
return this;
}
と
Eigen::MatrixXd AlgorithmPointBased::UpdateTranslationMatrix( int clusterIndex )
{
double membershipSum = 0,outcome = 0;
double currentPower = 0;
Eigen::MatrixXd outcomePoint = Eigen::MatrixXd(2,1);
outcomePoint << 0,0;
Eigen::MatrixXd templatePoint;
for (int i=0;i< imageDataVector.size();i++)
{
currentPower =0;
membershipSum += currentPower = pow(membershipMatrix[clusterIndex][i],m);
outcomePoint.noalias() += (*imageDataVector[i] - (prototypeVector[clusterIndex]->rotationMatrix*prototypeVector[clusterIndex]->scalingMatrix* ( *templateCluster->templatePointVector[prototypeVector[clusterIndex]->assosiatedPointIndexVector[i]]) ))*currentPower ;
}
outcomePoint.noalias() = outcomePoint/=membershipSum;
return outcomePoint; //.ConvertToMatrix();
}
ご覧のとおり、これらの関数は多くの行列演算を実行します。そのため、Eigen を使用するとアプリケーションが高速化されると考えました。残念ながら (上で述べたように)、プログラムの動作は遅くなります。
これらの機能を高速化する方法はありますか?
DirectX の行列演算を使用すると、パフォーマンスが向上するのではないでしょうか?? (ただし、グラフィックカードが統合されたラップトップを使用しています)。