私は大学のプロジェクトに取り組んでおり、MKL (11.1.) で実装されているいくつかの三重対角固有値ソルバーの内訳を提供するよう求められています。そのためのテストベッドを実装しましたが、現在、これを vtune (Intel VTune Amplifier XE 2013 Update 16) でプロファイリングしようとしています。ボトルネックを見つける必要があります。つまり、コードのどの部分 (私のものではなく MKL) と、固有値ソルバーによって呼び出されるどの関数に最も多くの時間を費やしているかを見つける必要があります。
そのために、各関数とその呼び出し先で費やされた合計時間を取得したいと考えていました。ただし、取得しているのは各関数のセルフタイムだけです。
私のコードはicc 14.0/3.174でコンパイルされ、MKLを静的および動的にリンクして両方を試しました。
ここでばかげたことを見落としていないことを願っています。また、必要な値を見つける方法に関する他の提案にも非常にオープンです。