HTMLページ(特にユーザー名)で何かをgrepしようとするときに、次のように言って文字列を取得しようとするというこの問題が発生しています。
egrep -o dir\=\"[ltr]*\"\>.*(\<\/span|\<\/a)
これにより、「dir=("ltr or rlt")> の後、最初のタグ</a>
または</span>
終了タグの前に何かを取得します。
たとえば、次のようになります。
dir="ltr">myusername</span>
また
dir="rtl">myusername</a>
ただし、1 行に複数の span タグがあり、最初のタグの後に停止しないため、不要なデータが生成されます。
最初の正規表現の後に停止するように現在の正規表現を変更する方法はありますか? そして、なぜ読み続けるのでしょうか?
ありがとう