0

コードでこのタイプのスプラインを使用していますが、アルゴリズムが SIMD 命令の使用から恩恵を受けることができるかどうか疑問に思っています。(ARM の NEON) 使用されるコードは、次のソース (Fortran で) の C 翻訳です。

あなたの経験から、このコードが SIMD 命令を使用して最適化される可能性があるかどうかわかりますか?

コードを「通常の」コードから SIMD 命令を使用するコードに変換するためのガイドラインはありますか?

ありがとう

4

1 に答える 1

3

ループにはシリアル依存関係があるように見えるので、SIMDを使用したベクトル化に簡単に役立つ唯一の方法は、並列で操作できる複数のデータセット(例:4)がある場合です。これらのデータセットは同じサイズである必要があります。

于 2012-02-08T09:47:50.997 に答える