別の投稿で説明されている誰かと同じ問題があります。私のアプリケーションのログ ファイルは非常に大きく (~1GB)、ログ ファイルからの情報を関連付けるために grep を使用するのは面倒です。現在、「less」ツールを使用していますが、思ったよりも遅くなります。
検索を高速化することを考えています。これを行うには、次の方法があります。まず、XML でログを生成し、XML 検索ツールを使用します。XML 検索を使用してどの程度の速度向上が得られるかはわかりません (インデックスを使用しないファイル検索にはまだ時間がかかるため、それほどではないと思います)。
次に、XML データベースを使用します。これはより良いでしょうが、ここにはあまり背景がありません。
3 番目に、(非 XML) データベースを使用します。テーブル スキーマを記述する必要があるため、これはやや面倒です (上記の 2 番目のオプションでも行う必要がありますか?)。また、一般的なユースケースを含めるために、最初にスキーマが大幅に変更されることも予測しています。理想的には、ログを保存するための本格的なデータベースよりも軽量なものが必要です。
4 番目に、lucene を使用します。目的には合っているようですが、現在のユースケースのインデックスを指定する簡単な方法はありますか? たとえば、「「反復」という単語が表示されるたびにインデックスを付けてください」と言いたいです。
あなたの意見は何ですか?