私は現在、いくつかのクライアントのタスクを取得して処理するサーバーを備えたシステムを開発しています。
高いスループットが必要なため、1Gbit ネットワークでの往復/秒の速度を調べました。
シナリオ:
- クライアントにはディーラー ソケットがあり、サーバーにタスクを送信し、サーバーはルーター ソケット (TCP 接続) でタスクを受信します。
- サーバーはタスクを 1 つのワーカー スレッド (ディーラー - INPROC 経由のディーラー) に転送します。
- ワーカー スレッドはタスクを処理し、同じ方法で応答を返します。
ベンチマークには、16 台のマシンで 16 台のクライアントを使用しました。
ベンチマーク 1: (ワーカーなしで、サーバーはメッセージをクライアントに直接送信します) 結果:
- 1B-メッセージ: 143540,67 RT/s (RT = 往復)
- 10B-メッセージ: 140160,72 RT/秒
- 100B-メッセージ: 129634,43 RT/秒
- 500B-メッセージ: 120977,5 RT/s
- 1024B-メッセージ: 107983,59 RT/秒
ベンチマーク 2: (worker が 10 の場合、サーバーは単にブローカーとして機能します)
- 1B-メッセージ: 92873,51 RT/s (RT = 往復)
- 10B-メッセージ: 81619,33 RT/秒
- 100B-メッセージ: 83606,02 RT/秒
- 500B-メッセージ: 75229,45 RT/秒
- 1024B-メッセージ: 63648,32 RT/s
ソース:
- http://pastebin.com/5JBD0DUH (ベンチマーク 1)
- http://pastebin.com/3iq2Bxqc (ベンチマーク 2)
ワーカー スレッドを使用して inproc-roundtrip を追加するだけで TP がそれほど低下する理由を特定するのを誰かが手伝ってくれますか? ワーカー スレッドでより高い TP を期待していました。ZMQ Inproc Performance はそれほど速くないのですか?