0

AWS ECS スケールイン スケールアウトの CloudWatch アラームを定義しました。

通常は問題なく動作します。しかし、時々以下のエラーで失敗します。500 はスケールアウトのしきい値です。メトリック時間は 5 分ごとです。スケールアウト データポイントは 2 の 1 です (1 つの値が 10 分間でしきい値を超えることを意味します)。

"error": "メトリック値 [437.08774491907025, 516.9558339660845] および違反しきい値 500.0 のステップ調整が見つかりませんでした"

ステップ調整は次のように定義されます。

 step_adjustment {
      metric_interval_lower_bound = 0
      scaling_adjustment          = 1
    }

アラーム構成:

datapoints_to_alarm         = "1"
  evaluation_periods        = "2"
  threshold                 = "500"

アラーム作成用の Terraform コード

resource "aws_appautoscaling_policy" "task_count_up" {
  name               = "appScalingPolicy_${aws_ecs_service.sqs_to_kinesis.name}_ScaleUp"
  service_namespace  = "ecs"
  resource_id        = "service/${aws_ecs_cluster.shared-elb-access-logs-processor.name}/${aws_ecs_service.sqs_to_kinesis.name}"
  scalable_dimension = "ecs:service:DesiredCount"

  step_scaling_policy_configuration {
    adjustment_type         = "ChangeInCapacity"
    cooldown                = "${var.scale_up_cooldown_seconds}"
    metric_aggregation_type = "Maximum"

    step_adjustment {
      metric_interval_lower_bound = 0
      scaling_adjustment          = 1
    }

  }

  depends_on = [
    "aws_appautoscaling_target.main",
  ]
}

resource "aws_appautoscaling_policy" "task_count_down" {
  name               = "appScalingPolicy_${aws_ecs_service.sqs_to_kinesis.name}_ScaleDown"
  service_namespace  = "ecs"
  resource_id        = "service/${aws_ecs_cluster.shared-elb-access-logs-processor.name}/${aws_ecs_service.sqs_to_kinesis.name}"
  scalable_dimension = "ecs:service:DesiredCount"

  step_scaling_policy_configuration {
    adjustment_type         = "ChangeInCapacity"
    cooldown                = "${var.scale_down_cooldown_seconds}"
    metric_aggregation_type = "Minimum"

    step_adjustment {
      metric_interval_upper_bound = 0
      scaling_adjustment          = -1
    }

  }

  depends_on = [
    "aws_appautoscaling_target.main",
  ]
}
4

0 に答える 0