45のスレーブ(起動を処理する1つのマスター)にまたがる高度に並列化されたビルドがあります。
私が直面している問題は、仕事の約3%が消えることです。
プロジェクトのセットアップは「マスター」ジョブであり、(パラメーター化されたジョブプラグインを介して)N個のスレーブ間でN個のジョブを起動します。ほとんどの場合、マスタージョブのコンソール出力は、分散ビルドステップのジョブ番号に関して正しいです。
ただし、コンソールに表示されるジョブが実際にはまったく異なるビルドに属している場合があります。
これを追跡するためにどこから始めればよいですか?jenkinsログには、失敗したジョブやジョブの起動の問題に関する情報が不気味に空になっています。
現時点での私の最善の推測は、行方不明のジョブは、何かが起こってそれらを削除したときに、実際にはエグゼキュータを待ってキューに入れられていたということです。しかし、これを裏付ける証拠はありません。
考え、提案、役立つリンクはすべて大歓迎です、