2

私はSOLR Cloud、多くのランダムなログベースのテキストにインデックスを付けて同じものを検索するための潜在的な解決策の1つとして調査しています。ログファイルのデータをに投稿することについての基本的な質問がありますSOLR

ログステートメントの最初のいくつかのフィールドは、スペースバーで区切られた重要なフィールド(、、など)ですtimestamp。これらのフィールドの終わりとフリーテキストの始まり(それ自体に多くのスペース文字が含まれています)severityをどのように判断しますか?SOLR

たとえば、次のようになります。「タイムスタンプModuleName重大度messageIdスペースで区切られる多くのフリーテキスト。」

にフリーテキストを追加できる場合SOLR、どうすれば検索できますか?SOLRフリーテキストはインデックスの一部ではないため、検索できないと思います。もしそうなら、どうすればフリーテキストの一部もインデックスに登録できますか?ですから、フリーテキストから興味のあるフィールドがいくつかあるかもしれません。私もそれらを検索したいと思うかもしれません。

たとえば、次のようなステートメントです。

" Timestamp ModuleName Severity messageId-スペースで区切られるが、検索可能なexternalResponseValueを含む多くのフリーテキストがありますが、すべてのログ行にそれがあるわけではなく、その位置も表示される行内で固定されていません。"

ありがとう!

スミット

4

1 に答える 1

1

あなたはDIHをチェックすることができます:-

LineEntityProcessorを使用して、ログファイルを1行ずつ処理します。RegexTransformer
を 使用して、行をフラグメントに分割し、それに応じてフィールドにこれらを入力します。 これには、個々のフィールドのすべてのデータが含まれます。検索可能にするテキストフィールドにインデックスを付ける場合。

于 2012-11-07T11:28:49.837 に答える