c++ - fork() とコピーオンライトメモリ共有をより効率的に使用する

Question

Linux ベースのサーバーを使用してマルチプレイヤーオンラインゲームを開発しているプログラマーです。私たちは、私たちの世界に「インスタンス化された」アーキテクチャを使用しています。つまり、ワールドエリアに入る各プレイヤーは、そのエリアのコピーを取得して、同じエリアでプレイしている他のすべてのプレイヤーとは関係なく、パーティメンバーと一緒にプレイできます。

内部的には、インスタンスごとに個別のプロセスを使用します。最初に各インスタンスプロセスが起動し、特定のエリアに必要なリソースのみを読み込み、ランダムな地形を生成してから、プレイヤーからの新しい接続を許可します。インスタンスによって使用されるメモリの量は、通常、リソースとエンティティでランダムに生成されたレベルを含めて約 25 メガでした。

インスタンスのメモリフットプリントを削減し、スポーン時間を短縮するために、インスタンスが必要とする可能性のあるすべてのリソース (約 150 MB のメモリ) をロードする単一のマスターインスタンスを作成してから、新しいインスタンスが必要な場合は、fork() 関数を使用して新しいインスタンスを生成し、コピーオンライトメモリ共有を利用して、新しいインスタンスが「一意の」データセット用のメモリのみを必要とするようにします。各インスタンスの一意のデータを構成するランダムに生成されたレベルとエンティティのフットプリントは、約 3 ～ 4 MB のメモリです。

残念ながら、メモリ共有は私が思うほどうまく機能していません。多くのメモリページが非共有になっているようです。

最初は、より多くのデータセットをプレフォークインスタンスにロードすると、フォークされた各インスタンスに必要なメモリが減少しますが、最終的には、プレフォークにより多くのアセットをロードすると、フォークされた各インスタンスによって使用されるデータが実際に増加するという変曲点があります。

私たちが得た最良の結果は、フォーク前に約 80 メガバイトのデータセットをロードし、その後、新しいインスタンスデマンドに残りをロードさせることです。これにより、インスタンスごとに約 7 ～ 10 メガバイトの余分なメモリと、80 メガバイトの固定コストが発生します。確かに良い改善ですが、理論上の最善ではありません。

150 メガのデータセット全体をロードしてからフォークすると、フォークされた各インスタンスはさらに約 50 メガバイトのメモリを使用します! 単に何もしないよりもはるかに悪い。

私の質問は、すべてのデータセットを prefork インスタンスにロードし、各インスタンスのメモリフットプリントとして、インスタンスごとに本当に一意のデータの最小セットのみを取得できるようにする方法です。

私はここで何が起こっているのかについて理論を持っており、誰かがこれが事実であることを確認するのを助けることができるかどうか疑問に思っていました.

それはmallocフリーチェーンに関係していると思います。プリフォークインスタンスの各メモリページには、おそらくメモリの空きスポットがいくつか残っています。ランダムレベルの生成中に、たまたまページ内のフリースポットの 1 つに収まるものが割り当てられた場合、そのページ全体がフォークされたプロセスにコピーされます。

Windows では、代替ヒープを作成し、プロセスで使用される既定のヒープを変更できます。これが可能であれば、問題は解消されます。Linuxでそのようなことを行う方法はありますか? 私の調査では、あなたにはできないことが示されているようです。

もう 1 つの解決策として、既存の malloc フリーチェーンを何らかの方法で破棄し、malloc にオペレーティングシステムから新しいメモリを割り当てさせて、後続の呼び出しに使用させることができます。これが簡単にできるかどうか、malloc の実装を調べてみましたが、やや複雑なように思えました。この分野に関するアイデアや、このアプローチをどこから始めるべきかについての提案があれば、ぜひ聞いてみたいと思います。

最後に、ここで何がうまくいかないのかについて他のアイデアを持っている人がいれば、ぜひ聞いてみたい. どうもありがとう！

score 2 · Accepted Answer

Windows では、代替ヒープを作成し、プロセスで使用される既定のヒープを変更できます。これが可能であれば、問題は解消されます。Linuxでそのようなことを行う方法はありますか?

mmap(2)Unixでは、バイパスmallocを完全に記憶することができます。

また、「牛に頼る」こと全体を捨てます。マスターにmmapいくつかのメモリ（80M、150Mなど）を処理させ、それに書き込み、mprotect(2)適切な測定のために読み取り専用としてマークし、そこから取得します。これにより、実際の問題が解決され、将来的にコードを変更する必要がなくなります。

c++ - fork() とコピー オン ライト メモリ共有をより効率的に使用する

1 に答える 1

Related

Reference

c++ - fork() とコピーオンライトメモリ共有をより効率的に使用する