これを Azure の Twitter サポート (ServerFault.com ではなく) からここに投稿するように依頼されました。
私たちの Kubernetes 環境は、1 週間以上にわたって変更を加えることなく素晴らしく機能しており、24 個の VHD はすべて Azure 上のコンテナー サービスを使用しています。
その後、すべてのサービスが停止したというアラートを突然受け取ります。Persistent Volume Claims を使用するすべてのポッドが ContainerCreating で停止します。簡単なkubectl describe pod podname
ショー:
Unable to mount volumes for pod "***-1370023040-st581_default(9b050936-1baa-11e7-9b77-000d3ab513dc)": timeout expired waiting for volumes to attach/mount for pod "default"/"***-1370023040-st581". list of unattached/unmounted volumes=[***-persistent-storage]
と
Error syncing pod, skipping: timeout expired waiting for volumes to attach/mount for pod "default"/"***-1370023040-st581". list of unattached/unmounted volumes=[***-persistent-storage]
すべてのポッドで。
Azure ポータルでは、エージェントに対して、エージェント OS VHD のみがディスクとして接続されていることがわかります。ディスクを手動で追加しようとすると、次のエラーで失敗します。
Failed to update disks for the virtual machine 'k8s-agent-CD93CDEA-0'. Error: A disk named '***mgmt-dynamic-pvc-018bdc6e-161a-11e7-8ca8-000d3ab513dc.vhd' already uses the same VHD URL …https://***.blob.core.windows.net/vhds/***mgmt-dynamic-pvc-018bdc6e-161a-11e7-8ca8-000d3ab513dc.vhd ….
エージェント/マスターを再起動しても問題は解決しません。
エージェントには、32 個のデータ ディスクをサポートする F16S を使用しています。
VHD を再接続して再開するにはどうすればよいですか?