コードでこのタイプのスプラインを使用していますが、アルゴリズムが SIMD 命令の使用から恩恵を受けることができるかどうか疑問に思っています。(ARM の NEON) 使用されるコードは、次のソース (Fortran で) の C 翻訳です。
- http://pages.cs.wisc.edu/~deboor/pgs/chol1d.f (最も CPU を消費する手順)
- http://pages.cs.wisc.edu/~deboor/pgs/setupq.f (セットアップ手順)
- http://pages.cs.wisc.edu/~deboor/pgs/smooth.f (上記の手順を呼び出すメイン関数)
あなたの経験から、このコードが SIMD 命令を使用して最適化される可能性があるかどうかわかりますか?
コードを「通常の」コードから SIMD 命令を使用するコードに変換するためのガイドラインはありますか?
ありがとう