awkで HTML ドキュメントを解析しようとしています。
ドキュメントには複数の<div class="p_header_bottom"></div
ブロックが含まれています
<div class="p_header_bottom">
<span class="fl_r"></span>
287,489 people
</div>
<div class="p_header_bottom">
<span class="fl_r"></span>
5 links
</div>
私は使っている
awk '/<div class="p_header_bottom">/,/<\/div>/'
そのようなすべてのdivを受け取ります。
最初の番号から番号を取得するにはどうすればよい287,489
ですか?
実際awk '/<\/span>/,/people/'
には正しく動作しません。