私は、Twitter APIを介して関連するTwitterフィードを読み取り、将来の分析のためにPostgreSQLデータベースに保存する研究プラットフォームに取り組んでいます。ミドルウェアはPerlであり、サーバーはDebianlinuxを実行する8GBのRAMを搭載したHPML310です。
問題は、Twitterフィードが非常に大きくなる可能性があり(1秒あたりのエントリ数が多い)、次のツイートを待つために戻る前に挿入を待つ余裕がないことです。つまり、私が行ったことは、fork()を使用して、各ツイートがデータベースとリスナーに挿入する新しいプロセスを取得し、すぐに戻って次のツイートを取得することです。ただし、これらの各プロセスはPostgreSQLバックエンドへの新しい接続を効果的に開くため、システムがTwitterフィードに追いつくことはありません。
私は、接続プールの提案を使用したり、必要に応じてハードウェアをアップグレードしてこれを機能させることを歓迎しますが、アドバイスをいただければ幸いです。これはRAMにバインドされている可能性がありますか、それともシステムを十分に高速化するために試みることができる構成またはソフトウェアのアプローチがありますか?