_mm512_storenrngo_pdと_mm512_storenr_pdの違いは何ですか?
_mm512_storenr_pd(void * mt, __m512d v):
v からメモリ アドレス mt にパックド倍精度 (64 ビット) 浮動小数点要素を、プロセッサへの読み取りなしヒントと共に格納します。
読まないヒントが何を意味するのか、私にはわかりません。それは、非キャッシュ コヒーレント書き込みであるということですか。再利用にはコストがかかる、または一貫性がないということですか?
_mm512_storenrngo_pd(void * mt, __m512d v):
v からメモリ アドレス mt にパックド倍精度 (64 ビット) 浮動小数点要素を格納し、読み取りなしのヒントを指定し、順序付けが弱いメモリ整合性モデルを使用します (この関数で実行されるストアはグローバルに順序付けされず、以降のストアはそれらの前に同じスレッドを観察できます)。
基本的には と同じstorenr_pd
ですが、弱い整合性モデルを使用しているため、プロセスは他のプロセッサよりも先に自身の書き込みを表示できることを意味します。しかし、別のプロセッサのアクセスは一貫性がないか、より高価ですか?