getratings github プロジェクトのnode.js および jsdom ベースのgetratings.jsスクリプトを使用して、 NewEgg、BestBuy などのサイトからユーザー レビューを収集しています。
スクリプトは EC2 マイクロ インスタンスでホストされます。約 12 を超える同時リクエストがサービスに送信されるまで、正常に動作します。それを超えると、ホストのリソースとメモリの使用率が非常に高くなり、クライアントへの応答に時間がかかります。
メモリリークの処理を試みました。リクエストの処理が完了すると、メモリ使用量は最終的に低下しますが、使用量のピークは非常に高くなります。
リソースの使用に関して、jsdom を介した html の処理をより効率的にするために何かできることはないかと考えていました。