Halide 言語で記述されたコードに使用できるパフォーマンス カウンターはありますか? コードで実行されるロード、ストア、および ALU 操作の数を知りたいです。
マルチステージ パイプラインのスケジューリングに関する Halide チュートリアルでは、割り当てられたメモリ、ロード、ストア、および Halide Funcs への呼び出しの量を比較することで、さまざまなスケジュールを比較していますが、この情報がどのように収集されたかはわかりません。これらの操作のいずれかが発生するたびに、trace_stores、trace_loads、および trace_realizations を使用してコンソールに出力できる可能性があると思います。ただし、これは優れたオプションではありません。プログラムの実行が大幅に遅くなり、コンソール出力の長いリストをロード、ストア、および ALU 操作の目的のカウントにコンパイルするために、ある種のカウント スクリプトが必要になるためです。