サーバーのメモリが完全にいっぱいになり、使用されたため、サーバーが通常のプロセスとチェックの一部に失敗し始めたという問題がありました。
ログの履歴を調べたところ、いくつかの Java プロセスが殺されていることがわかりました。
「top」コマンドを使用して、現在(問題が修正された後)どのプロセスが最も多くのメモリを消費しているかを確認しましたが、それは Java プロセスでした。つまり、現在どのプロセスが最も多くのメモリを占有しているかを知ることができます。
私が知りたいのは、障害が発生し始めたときにどのプロセスが最も多くのメモリを占有していたかを確認する方法があるかどうかです。おそらく、Linux は特定の時間のメモリ使用量を追跡またはログに記録しているでしょうか? よくわかりませんが、そのような詳細を見ることができれば素晴らしいと思います。