Xcode4.5.2を「AppleLLVMCompiler4.1」(Clang)で使用しています。
AVXが有効になっている(_mm256 *関数と__m256変数がまだない)SSE組み込み関数に大きく依存するコードをコンパイルしようとしましたが、SSE4.2のみが有効になっている場合に取得するコードが遅くなりました。
これについての合理的な説明はありますか?
Xcode4.5.2を「AppleLLVMCompiler4.1」(Clang)で使用しています。
AVXが有効になっている(_mm256 *関数と__m256変数がまだない)SSE組み込み関数に大きく依存するコードをコンパイルしようとしましたが、SSE4.2のみが有効になっている場合に取得するコードが遅くなりました。
これについての合理的な説明はありますか?
現在、LLVMは、たとえばこのようなAVXパフォーマンスに関連するバグを開いています。
完全なavx関連のバグリストはここにあります。