AWS ECS スケールイン スケールアウトの CloudWatch アラームを定義しました。
通常は問題なく動作します。しかし、時々以下のエラーで失敗します。500 はスケールアウトのしきい値です。メトリック時間は 5 分ごとです。スケールアウト データポイントは 2 の 1 です (1 つの値が 10 分間でしきい値を超えることを意味します)。
"error": "メトリック値 [437.08774491907025, 516.9558339660845] および違反しきい値 500.0 のステップ調整が見つかりませんでした"
ステップ調整は次のように定義されます。
step_adjustment {
metric_interval_lower_bound = 0
scaling_adjustment = 1
}
アラーム構成:
datapoints_to_alarm = "1"
evaluation_periods = "2"
threshold = "500"
アラーム作成用の Terraform コード
resource "aws_appautoscaling_policy" "task_count_up" {
name = "appScalingPolicy_${aws_ecs_service.sqs_to_kinesis.name}_ScaleUp"
service_namespace = "ecs"
resource_id = "service/${aws_ecs_cluster.shared-elb-access-logs-processor.name}/${aws_ecs_service.sqs_to_kinesis.name}"
scalable_dimension = "ecs:service:DesiredCount"
step_scaling_policy_configuration {
adjustment_type = "ChangeInCapacity"
cooldown = "${var.scale_up_cooldown_seconds}"
metric_aggregation_type = "Maximum"
step_adjustment {
metric_interval_lower_bound = 0
scaling_adjustment = 1
}
}
depends_on = [
"aws_appautoscaling_target.main",
]
}
resource "aws_appautoscaling_policy" "task_count_down" {
name = "appScalingPolicy_${aws_ecs_service.sqs_to_kinesis.name}_ScaleDown"
service_namespace = "ecs"
resource_id = "service/${aws_ecs_cluster.shared-elb-access-logs-processor.name}/${aws_ecs_service.sqs_to_kinesis.name}"
scalable_dimension = "ecs:service:DesiredCount"
step_scaling_policy_configuration {
adjustment_type = "ChangeInCapacity"
cooldown = "${var.scale_down_cooldown_seconds}"
metric_aggregation_type = "Minimum"
step_adjustment {
metric_interval_upper_bound = 0
scaling_adjustment = -1
}
}
depends_on = [
"aws_appautoscaling_target.main",
]
}