私はIntel 組み込みガイドから展開および圧縮操作を勉強していました。私はこれらの2つの概念について混乱しています:
為に__m128d _mm_mask_expand_pd (__m128d src, __mmask8 k, __m128d a) == vexpandpd
a から連続するアクティブな倍精度 (64 ビット) 浮動小数点要素 (マスク k にそれぞれのビットが設定されているもの) をロードし、書き込みマスク k を使用して結果を dst に格納します (要素は、対応するマスク ビットが設定されていません)。
為に__m128d _mm_mask_compress_pd (__m128d src, __mmask8 k, __m128d a) == vcompresspd
a のアクティブな倍精度 (64 ビット) 浮動小数点要素 (それぞれのビットが書き込みマスク k に設定されているもの) を dst に連続して格納し、残りの要素を src から渡します。
より明確な説明や説明できる人はいますか?