ネオン命令を使用してARMアセンブラで記述されたコードのパフォーマンスを向上させようとしています。
テストと計算には、次の計算機を使用します:http: //pulsar.webshaker.net/ccc/sample-706454b3
行"n.34-01c n0"で、突然ネオンユニットが10サイクル待機(?)しなければならないように見えることに気づきました。その理由は何でしょうか、それとも電卓のバグなのですか?
また、ARM/Neonアセンブラのパフォーマンスを向上させるための一般的な情報も必要です。
ターゲットはARMCortex-A9です。コンパイルには、インラインアセンブラを備えた最新のandroid-ndkを使用します。ありがとうございました。