sse/sse2 を使用して行列ベクトル乗算を実装する必要があります。ベクトルと行列が大きい。行列は double、ベクトルは float です。
ポイントは、フロートで実行する必要があるすべての計算です-マトリックスからデータを取得すると、それをフロートに昇格させ、計算を行い、フロートベクトルを取得します(後でフロートで追加の計算を行った後、いくつかのフロート値を追加する必要があります(フロート行列) を double 値 (double 行列) に変換します。
私の質問は、SSE/SSE2 を使用してそれを行う方法です-問題は double にあります-double* へのポインターがあり、__mm128 に収まるように 4 つの double を 4 つの float に変換する必要があります...それを行うための指示はありますか? ?