最近 Knative の調査を開始し、同時実行と自動スケーリングがどのように機能するかを理解しようとしています。(ターゲット) 同時実行数とは、特定のリビジョンの 1 つの Pod に同時にスケジュールできるリクエストの数を指すことを理解しています。
ただし、同時実行数の値が 1 より大きい場合の影響を理解しているかどうかはわかりません。N 個のリクエストが同じ Pod にスケジュールされている場合はどうなりますか? それらは FIFO 順で一度に 1 つずつ処理されますか? 複数のスレッドが生成され、並行して処理されますか (CPU リソースをめぐって競合する可能性があります)?
concurrency=1 に設定し、複数の Pod を介して複数のリクエストを処理するために自動スケーリングに頼りたくなりましたが、これは最善の方法ではないと思います。
前もって感謝します