インテル アーキテクチャのリファレンス マニュアルhttp://www.cs.princeton.edu/courses/archive/spr12/cos217/reading/ia32opt.pdfを何気なく読んでいて、命令のレイテンシとスループットの付録を読んでいたときに、 sqrt 命令のレイテンシ (実行コアが命令を形成するすべての μop の実行を完了するために必要なクロック サイクル数) が、除算のレイテンシ (ページ上) とまったく同じであることを発見しました。 C-28) 命令 -- 少なくとも一部のマイクロアーキテクチャでは。数値は、単精度、倍精度、および拡張精度に対して、それぞれ 30、40、および 44 クロック サイクルでした。
私の質問は、sqrt 命令を div 命令と同じくらい大きなプロセッサ シンクにする方法を教えてください。私は常に、sqrt 命令はどの言語でもコストがかかるという印象を受けてきました。