現時点では、ファイラーの膨大な量のログ (30G/日 x 3 マシン = 平均 100G) を保存しています。ログは圧縮されています。
そのログを検索する実際のツールは、対応するログを (時間範囲に従って) 検索し、それらをローカルにコピーし、解凍し、xml で情報を検索して表示します。
私たちは、そのログを検索するためのスパンクのようなツールを作成する可能性を研究しています (これは、他のシステムに送信されるメッセージ バス : xml-messages の出力です)。
圧縮されたログファイルを直接クエリする代わりに、mongo のようなデータベースに依存する利点は何ですか? また、データベース内の一部のデータにインデックスを付けて、プログラムに対象の zip ファイルを検索させることもできます...何が mongodb をもたらしますか...または hadoop をさらに ?