regex - 正規表現はコアダンプを与える

Question

HTMLタグでいっぱいのIMDBトップ250リスト（ページソースから）から映画名を解析しようとしています。正規表現がありますが、grep コマンドで実行すると、しばらくするとコアダンプが発生します。コマンドは次のとおりです grep -o -P ">[[A-Z]+\w* ([a-zA-Z]+\w* ?)*<" film.xml。このコアダンプの理由は何ですか?

score 2 · Accepted Answer

あなたが何をしようとしているのか正確にはわかりませんが、試してみてください：

grep -o -P ">[A-Z]\w*( [a-zA-Z]\w*)* ?<" film.xml

score 1 · Accepted Answer

あなたの正規表現は貪欲すぎます。これは通常*、それ自体が*. *andの数を減らすか、+貪欲でない形式を使用してください: *?and +?、それは大いに役立ちます。

regex - 正規表現はコアダンプを与える

2 に答える 2

Related

Reference