9

私はIntel 組み込みガイドから展開および圧縮操作を勉強していました。私はこれらの2つの概念について混乱しています:

為に__m128d _mm_mask_expand_pd (__m128d src, __mmask8 k, __m128d a) == vexpandpd

a から連続するアクティブな倍精度 (64 ビット) 浮動小数点要素 (マスク k にそれぞれのビットが設定されているもの) をロードし、書き込みマスク k を使用して結果を dst に格納します (要素は、対応するマスク ビットが設定されていません)。

為に__m128d _mm_mask_compress_pd (__m128d src, __mmask8 k, __m128d a) == vcompresspd

a のアクティブな倍精度 (64 ビット) 浮動小数点要素 (それぞれのビットが書き込みマスク k に設定されているもの) を dst に連続して格納し、残りの要素を src から渡します。

より明確な説明や説明できる人はいますか?

4

1 に答える 1