あなたはどれくらいやりたいですか、そしてサーバーは何をしなければなりませんか?
最近の最も一般的なアプローチはSIPです(「読み方を知っている」ということです-これは公開仕様、Google、RFCであり、かなり長い間続いています)。良い点は、SIP はサーバー上でオーディオをまったく処理しないことです;) ほら、なんらかのオーディオ再生を行わない限り、誰もサーバーと会話したくありません。電話システムを使用するときは、誰かと話します。サーバーにではありません。
SIP は SESSION INITIATION を扱います - これは制御プロトコルです。実際のオーディオなどのストリームは、RTP と RTSP を介して行われます。これもパブリック プロトコルです。楽しく読んでください (真剣に、それらは複雑です)。サーバー上でオーディオ ストリームが必要でない限り (録音など)、サーバーがそれらを見る必要さえありません。SIP は、2 つのクライアント間のセッションを直接セットアップするのにまったく問題ありません。SIP は現在、MOST (はるかに) VOIP によって行われています。定義済みのライブラリを使用できます。それ以外の場合は、非常に多くのデバッグの世界にいます。申し訳ありません;)