0

HTMLタグでいっぱいのIMDBトップ250リスト(ページソースから)から映画名を解析しようとしています。正規表現がありますが、grep コマンドで実行すると、しばらくするとコア ダンプが発生します。コマンドは次のとおりです grep -o -P ">[[A-Z]+\w* ([a-zA-Z]+\w* ?)*<" film.xml。このコア ダンプの理由は何ですか?

4

2 に答える 2

2

あなたが何をしようとしているのか正確にはわかりませんが、試してみてください:

grep -o -P ">[A-Z]\w*( [a-zA-Z]\w*)* ?<" film.xml
于 2013-08-24T19:14:43.077 に答える
1

あなたの正規表現は貪欲すぎます。これは通常*、それ自体が*. *andの数を減らすか、+貪欲でない形式を使用してください: *?and +?、それは大いに役立ちます。

于 2013-08-24T19:14:41.273 に答える