本番環境で Python デーモンを実行しています。7 ~ 120 のスレッドを使用します。最近、最小のインスタンス (7 スレッド) がハングを示し始めましたが、他のすべてのインスタンスはこの種の問題を示しませんでした。strace を Python プロセスにアタッチすると、すべてのスレッドが futex FUTEX_WAIT_PRIVATE を呼び出していることがわかります。そのため、おそらく何かをロックしようとしています。
このような問題をどのようにデバッグしますか?
これはフラッシュ メモリから実行される実稼働システムであるため、ディスクへの書き込みも制限されることに注意してください。