unix - 正規表現を使用してファイルを grep し、行の一致する部分のみを出力できますか?

Question

次のような多数のエラー行を含むログファイルがあります。

Failed to add email@test.com to database

これらの行を 1 回の grep 呼び出しでフィルタリングできます。

grep -E 'Failed to add (.*) to database'

これは問題なく動作しますが、私が本当にやりたいのは、grep (または出力を渡す別の Unix コマンド) に、一致した行の電子メールアドレス部分のみを出力させることです。

これは可能ですか？

score 14 · Accepted Answer

14

sedgrepなしで問題ありません：

sed -n 's/Failed to add \(.*\) to database/\1/p' filename

于 2009-06-10T10:33:48.043 に答える

score 5 · Accepted Answer

sedを使用できます：

grep -E 'Failed to add (.*) to database'| sed 's/'Failed to add \(.*\) to database'/\1'

score 5 · Accepted Answer

GNU grep の最近のバージョンには、-oまさにあなたが望むことを行うオプションがあります。(-oは--only-matching)。

score 2 · Accepted Answer

これは仕事をするはずです：

grep -x -e '(?<=Failed to add ).+?(?= to database)'

肯定的な先読みアサーションを使用し、その後に電子メールアドレスの一致が続き、その後に後読みアサーションが続きます。これにより、行全体と一致することが保証されますが、実際には電子メールアドレスの部分のみが使用されます (したがって、返されます)。

この-xオプションは、grep がテキスト全体ではなく行と一致する必要があることを指定します。

score 1 · Accepted Answer

またはパイソン：

cat file | python -c "import re, sys; print '\r\n'.join(re.findall('add (.*?) to', sys.stdin.read()))"

score -2 · Accepted Answer

grepを使用する場合は、egrepを使用する方が適切です。

About egrep

Search a file for a pattern using full regular expressions.

grepは、正規表現の機能を常に備えているとは限りません。

9 に答える 9