regex - シェルスクリプトで複数の行パターンに正規表現を使用する方法

Question

複数行にまたがる html ファイル内のパターンを見つける bash スクリプトを作成したいと考えています。

正規表現のファイル:

<td class="content">
  some content
</td>
<td class="time">
  13.05.2013  17:51
</td>
<td class="author">
  A Name
</td>

<td>今、私は .tag で-tagの内容を見つけたいと思っていますclass="time"。

したがって、原則として次の正規表現：

<td class="time">(\d{2}\.\d{2}\.\d{4}\s+\d{2}:\d{2})</td>

grep私が使用できるコマンドではないようです...

では、どのようにして文字列のみを取得できるの13.05.2013 17:51でしょうか?

score 0 · Accepted Answer

試す：

awk '/^td class="time">/{gsub(ORS,x); print $2}' RS=\< FS=\> file

また

awk '/^td class="time">/{print $2}' ORS= RS=\< FS='>[[:space:]]*' file

3 に答える 3