ログ ファイルを調べていると、同じエラー メッセージに何度も遭遇することがよくあります。もちろん、タイムスタンプ、ユーザー名、IP アドレスなどにより、2 つの行が同一になることはありません。
「パーセント差」を設定する方法を探しており、すでに報告されているエラー メッセージと 90% 類似している行は無視します。もう 1 つの考えは、タイム スタンプの違いも常に無視することです。
手順:
- ユーザーが検索語を入力します (正規表現または単純なテキストのいずれか)
- ユーザー入力の差の許容範囲
[開始] - grep は検索語に一致する文字列を見つけ、新しいテキスト ファイルに送信します
- grep は引き続きログを検索し、同じエラー メッセージを見つけます。違いは、タイム スタンプ、日付、および場合によってはユーザー名である可能性があります。この行は、新しいファイルに既に含まれている行と少なくとも 90% 類似しているため、grep はそれをコピーせずに検索を続けます。
- grep は、検索語に一致する新しい行を見つけます。行は 90% 未満の類似性があるため、新しいファイルにコピーされ、grep が将来の結果と照合する別の行になります。
*編集: 初めてでわかりにくかったら申し訳ありません。必要に応じて、喜んでさらに説明します。
ありがとう。
- Log.1 - DD:MM:YYYY HH:MM:SS:MS エラー - ユーザーが IPADDRESS でログインに失敗しました
- Log.1 - DD:MM:YYYY HH:MM:SS:MS 起動時にハードウェアに障害が発生しました
- Log.2 - DD:MM:YYYY HH:MM:SS:MS リソースが引き伸ばされています。警告 - RAM を確認してください