私はSOLR Cloud
、多くのランダムなログベースのテキストにインデックスを付けて同じものを検索するための潜在的な解決策の1つとして調査しています。ログファイルのデータをに投稿することについての基本的な質問がありますSOLR
。
ログステートメントの最初のいくつかのフィールドは、スペースバーで区切られた重要なフィールド(、、など)ですtimestamp
。これらのフィールドの終わりとフリーテキストの始まり(それ自体に多くのスペース文字が含まれています)severity
をどのように判断しますか?SOLR
たとえば、次のようになります。「タイムスタンプModuleName重大度messageIdスペースで区切られる多くのフリーテキスト。」
にフリーテキストを追加できる場合SOLR
、どうすれば検索できますか?SOLR
フリーテキストはインデックスの一部ではないため、検索できないと思います。もしそうなら、どうすればフリーテキストの一部もインデックスに登録できますか?ですから、フリーテキストから興味のあるフィールドがいくつかあるかもしれません。私もそれらを検索したいと思うかもしれません。
たとえば、次のようなステートメントです。
" Timestamp ModuleName Severity messageId-スペースで区切られるが、検索可能なexternalResponseValueを含む多くのフリーテキストがありますが、すべてのログ行にそれがあるわけではなく、その位置も表示される行内で固定されていません。"
ありがとう!
スミット