複数の EC2 インスタンス (EBS ではなくインスタンス ストレージを使用) で実行されている Rails アプリがあります。頻繁に (思ったよりも頻繁に)、インスタンスに到達できなくなります (ping または ssh ができず、Amazon ELB がサービス停止中と報告します)。ただし、AWS コンソールでは、インスタンスは引き続き「実行中」と表示されます。インスタンスを再起動しても解決しません。インスタンスがこの到達不能状態になると、正常に再起動できますが、再起動後も到達不能のままです。唯一の代替手段は、それを終了して新しいインスタンスを開始することです。
なぜこれが起こっているのでしょうか?残念ながら、インスタンスが到達不能になると、インスタンスのログにアクセスできなくなります。私の監視ソフトウェアは、インスタンスが到達不能になる直前に、特定のメトリックにスパイクを表示しません。AWS コンソールからアクセスできるインスタンスのシステム ログには情報がありません (問題なく起動しているようです)。