0

3 つのノード (標準 DS3 v2 (4 vcpus、14 GB メモリ)) を持つ Azure AKS を作成しました。私はクラスターをいじっていて、1000 のレプリカを持つ Deployment を作成しました。この完全なクラスターがダウンした後。

azureuser@saa:~$ k get cs
NAME                 STATUS      MESSAGE                                                                                        ERROR
controller-manager   Unhealthy   Get http://127.0.0.1:10252/healthz: dial tcp 127.0.0.1:10252: getsockopt: connection refused   
scheduler            Unhealthy   Get http://127.0.0.1:10251/healthz: dial tcp 127.0.0.1:10251: getsockopt: connection refused   
etcd-0               Healthy     {"health": "true"}  

デバッグから、Scheduler と Controller-manager の両方がダウンしたようです。これを修正するには?

1000 個のレプリカを含む Deployment を作成すると、正確には何が起こりましたか? k8sで処理する必要がありますか?

いくつかのデバッグ コマンドが出力されます。

  kubectl cluster-info
    Kubernetes master is running at https://cg-games-e5252212.hcp.eastus.azmk8s.io:443
    Heapster is running at https://cg-games-e5252212.hcp.eastus.azmk8s.io:443/api/v1/namespaces/kube-system/services/heapster/proxy
    KubeDNS is running at https://cg-games-e5252212.hcp.eastus.azmk8s.io:443/api/v1/namespaces/kube-system/services/kube-dns:dns/proxy
    kubernetes-dashboard is running at https://cg-games-e5252212.hcp.eastus.azmk8s.io:443/api/v1/namespaces/kube-system/services/kubernetes-dashboard/proxy

kubectl cluster-info dump@ http://termbin.com/e6wbのログ

azureuser@sim:~$ az aks scale -n cg -g cognitive-games -c 4 --verbose
Deployment failed. Correlation ID: 4df797b2-28bf-4c18-a26a-4e341xxxxx. Operation failed with status: 200. Details: Resource state Failed

ノードが表示されない

azureuser@si:~$ k get nodes
No resources found
4

1 に答える 1

0

ばかげているように見えますが、AKS が RG で作成されると、驚くべきことに 2 つの RG が作成され、1 つは AKS で作成され、もう 1 つはすべての VMS を持つランダム ハッシュで作成されます。2 番目の RG を削除したところ、基本的な AKS が機能しなくなりました。

于 2018-02-13T12:11:57.957 に答える