EC2 の Elastic Load Balancer の背後に自動スケーリングされた Web/アプリ層があります。REST Web サービスのスロットルを設定して、1 秒あたりのトランザクション制限を適用したいと考えています。呼び出されているサービスと、リクエストで渡されたいくつかの独自の http ヘッダー情報に基づいて、それを強制したいと思います。ラバサーバーを立ち上げて着信リクエストを抑制し、ELB に転送するか、http 503 を返すことを考えていましたが、これを構築してテストするのがどれほど難しいか、またはまったく機能するかどうかはわかりません。
とにかく、ELB の前に何かをセットアップして、着信要求を抑制することはできますか? EC2 で Web サービスのスロットリングを実行するより良い方法はありますか?