ps aux
特定のジョブをリストアップするのに時間がかかる場合があることがわかりました。最初に他のいくつかのジョブを一覧表示し、次に数分間スタックしてから、そのジョブと残りのジョブを一覧表示します。
その特定の仕事は、分散トレーニング システムの計算負荷の高いワーカーです。このワーカーが停止していることは、他のワーカーからも観察されます。失速の理由はまだわかりませんが、それps aux
も関係しているのではないかと思います。
ps aux
特定の仕事をリストする速度に何が影響するか知っている人はいますか?