約 500,000 個のファイル {Ai} を処理するプログラムがあり、ファイルごとに解析用の定義 {Di} をフェッチします。
今のところ、各ファイル {Ai} は専用の celery タスクによって解析され、そのたびに定義ファイル {Di} が再度解析されてオブジェクトが生成されます。このオブジェクトは、ファイル {Ai} (JSON 表現) の解析に使用されます。
定義ファイル (生成されたオブジェクト) {Di(object)} を保存して、タスク全体で使用できるようにしたいと考えています。
だから私はそれを管理するための最良の選択は何だろうかと思います:
- Memcahe + Python-memcached、
- set(add)/get インターフェイスを使用してオブジェクトを「保存」する長時間実行タスク。
パフォーマンスとメモリ使用量に関して、最良の選択は何ですか?