NLB クラスターに 3 台のサーバーがあり、ステートレスで負荷の高い WCF サービスを展開してクラスターに負荷をかけています。
構成: ポート 80、マルチキャスト、アフィニティ: なし
次に、ワークステーションからクラスターに 32 個の要求を並列的に送信します。32 個の要求を完了するまでの合計時間は約 35 秒です。
2台のサーバーをオフにして、サービスを再度実行しようとしましたが、最終結果も約... 35秒です!!!?!?!?
これら 3 台のサーバーのタスク マネージャーを同時に見ると、1 台のサーバーが要求を処理している場合、他の 2 台はアイドル状態になり、要求が順次処理されていることがわかりました。リクエストは3つのサーバーすべてで並行して処理する必要があると思いました。
何が起こったのか理解できません。それらを間違って設定しましたか?誰でもこれについて説明がありますか?