3

複数行にまたがる html ファイル内のパターンを見つける bash スクリプトを作成したいと考えています。

正規表現のファイル:

<td class="content">
  some content
</td>
<td class="time">
  13.05.2013  17:51
</td>
<td class="author">
  A Name
</td>

<td>今、私は .tag で-tagの内容を見つけたいと思っていますclass="time"

したがって、原則として次の正規表現:

<td class="time">(\d{2}\.\d{2}\.\d{4}\s+\d{2}:\d{2})</td>

grep私が使用できるコマンドではないようです...

  1. -o丸括弧内の結果だけでなく、完全な行または を使用した完全な結果のみを返します(...)
  2. パターンは1行にしか見えません

では、どのようにして文字列のみを取得できるの13.05.2013 17:51でしょうか?

4

3 に答える 3

0

試す:

awk '/^td class="time">/{gsub(ORS,x); print $2}' RS=\< FS=\> file

また

awk '/^td class="time">/{print $2}' ORS= RS=\< FS='>[[:space:]]*' file
于 2013-09-15T09:40:33.063 に答える