Linux でプロセスが停止した理由を特定しようとしています。これは通信アプリケーションであり、かなりの負荷がかかる状態で実行されます。8 つの T1 スパンごとに個別のプロセスがあります。ときどき、プロセスの 1 つが非常に応答しなくなります。通常は非常にビジーなプロセスのログにイベントが記録されるまでに、最大 50 秒かかります。
システム リソースが不足している可能性があります。明らかなこと - CPU 使用率 - は問題ないようです。
この種のものをキャッチして分析するのに最適なLinuxユーティリティはどれですか?これは非常に負荷の高いシステムであるため、できるだけ目立たないようにしますか? システム指向ではなく、プロセスである必要があるように思われます。おそらく /proc/pid/XX の継続的な監視ですか? ここでは Top はあまり役に立たないようです。