テストステーションのグループで一連のPythonテストスクリプトを実行します。テストスクリプトはこれらのテストステーションのハードウェアユニットとインターフェイスするため、ステーションごとに一度に1つのテストスクリプトを実行する必要があります(すべてを仮想化することはできません)。さまざまなステーションにテストを割り当て、テスト結果を報告するツールを構築しました。これにより、何千ものテストをキューに入れて、夜間または任意の期間実行することができます。
時折、私たちが見つけたのは、テストステーションがクラスターから脱落することです。リモートでログインすると、黒い画面が表示され、再起動します。ログインすると、WindowsXPに「重大なエラー」が発生したことが通知されます。イベントログには、このエラーの記録が含まれていCategory: (102)
ますEvent ID: 1003
。
以前、これは何百もの一時的なFirefoxプロファイルの作成が原因であることがわかりました。テストではSelenium Webdriverを使用してWebサイトの操作を自動化し、新しいブラウザーを起動するたびに一時的なFirefoxプロファイルが作成されました。これらの一時的なFirefoxプロファイルを空にする各テストの間にクリーンアップのステップを追加しましたが、ステーションがいつかドロップアウトし、常にこの重大なエラーが発生してイベントログに記録されることがわかりました。
この問題の根本的な原因を見つけたいのですが、どうすればよいのかわかりません。イベントログエントリの読み取り方法に関する情報を検索しようとしましたが、役立つ情報は見つかりませんでした。この問題のデバッグに取り掛かる方法についての提案を歓迎します。