3

最適化のためにコードを SSE から ARM Neon に変換しようとしています。コードのほとんどの SSE 命令について、明らかに同等の Neon 命令をいくつか見つけました。ただし、これらにはいくつかの問題があります。

result1_shifted = _mm_srli_si128 (result1, 1);

result=_mm_packus_epi16 (res1,res2);

_mm_storeu_si128 (p_dest, result);

手伝っていただけませんか?

4

1 に答える 1