最適化のためにコードを SSE から ARM Neon に変換しようとしています。コードのほとんどの SSE 命令について、明らかに同等の Neon 命令をいくつか見つけました。ただし、これらにはいくつかの問題があります。
result1_shifted = _mm_srli_si128 (result1, 1);
result=_mm_packus_epi16 (res1,res2);
_mm_storeu_si128 (p_dest, result);
手伝っていただけませんか?