0

このタグ内のテキスト「これはタイトルです」を見つけるための正規表現は何ですか? Grep、Sed、または Awk を使用します。

コード例:

<h1 class="round title">
  <a href="/somepage">This is the title</a>
</h1>

上記のh1タグでこれを試しました。

curl --silent http://domain.com/index.html | grep "<h1 class=\"round title\">"

結果は次のとおりです。

<h1 class="round title"><a href="/somepage">This is the title</a></h1>

「これはタイトルです」の部分だけが必要です。

4

1 に答える 1

1

私はこの次のコマンドでそれを手に入れました。

curl --silent http://domain.com/index.html | grep -E "<h1.*><a.*>(.*?)</a></h1>" | sed 's/.*<a.*>\(.*\)<\/a>.*/\1/'

皆さん、ありがとうございました。

于 2012-09-03T06:14:08.017 に答える