n1-highmem-4 プールを使用して GKE クラスタ (バージョン: 1.18.15-gke.1500) を作成しようとしています。ヘルムチャートをインストールしようとするまで、すべて正常に動作します。Helm バイナリ (バージョン: 3.5.2) は、「http2 接続が失われました」というエラーで終了します。GKE が自動修復モードをトリガーします。kubectl を使用して configmap を問題なく作成しているため、理由がわかりません。プール マシンまたは GKE マスター プランに関するログを見つけることができる場所があるかどうかご存知でしたか?
1 に答える
このクラスターがどのように正確に作成されたか、どのリソースが適用されたかHelm
、クラスターからのログ (取得方法について説明します) に関する情報がなければ、問題とその背後にある理由を特定することは困難です。
概要:
GKE のノード自動修復機能は、クラスタ内のノードを正常な実行状態に保つのに役立ちます。有効にすると、GKE はクラスタ内の各ノードのヘルス状態を定期的にチェックします。ノードが長期間にわたって連続してヘルスチェックに失敗した場合、GKE はそのノードの修復プロセスを開始します。
-- Cloud.google.com: Kubernetes Engine: ドキュメント: 方法: ノードの自動修復: 概要
投稿された質問に答える:
プール マシンまたは GKE マスター プランに関するログを見つけることができる場所があるかどうかご存知でしたか?
はい。クラスターの状態とそのログを確認する方法はいくつかあります。
GKE
自動修復イベントのログ エントリを生成します。以下を使用してログを確認できます。
gcloud container operations list
出力は次のようになります。
operation-XXXXXXXXXXXXX-XXXXXXXX CREATE_CLUSTER europe-west3-c example-cluster DONE 2021-03-07T11:59:55.133563829Z 2021-03-07T12:03:09.684215827Z
operation-YYYYYYYYYYYYY-YYYYYYYY AUTO_REPAIR_NODES europe-west3-c gke-example-cluster-default-pool-AAAAAAAA-AAAA DONE 2021-03-07T12:21:14.814774338Z 2021-03-07T12:24:15.6305881Z
それに加えて、特定のノード ログを探すことができます: Google Cloud のオペレーション スイート (以前の Stackdriver)
次の方法でアクセスできます。
GCP Cloud Console (Web UI)
->Logging
->Upgrade
->Upgrade to the New Logs Explorer
以下のフィルターを使用してそれらのログを探します。
resource.type="k8s_node"
resource.labels.cluster_name="CLUSTER-NAME"
resource.labels.project_id="PROJECT-NAME"
resource.labels.location="ZONE"
その他のリソース: