最近のLinux分散共有メモリシステムで実行されているマルチスレッドアプリケーションで、リモート(非ローカル)NUMAメモリノードへのスレッドごとの要求数をカウントする簡単な方法はありますか?
PAPIを使用して相互接続トラフィックをカウントすることを考えています。これは行く方法ですか?
私のアプリケーションでは、スレッドはその存続期間全体にわたって特定のコアまたはプロセッサーにバインドされます。アプリケーションが起動すると、メモリはページごとに割り当てられ、使用可能なすべてのNUMAメモリノードにラウンドロビン方式で分散されます。
ご回答ありがとうございます。