bash スクリプトを使用して Web サイトの番号を取得したいと考えています。最初に Web ページを取得してから、ページを解析して数値を取得しようとします。
index.html には、必要な番号を含む長い行があります。
(...) </dl><dl class=""><dt>Year <dd> <a title="City" href="http://example.com/City">City</a> <em>(400)</em> </dd><dd> (...)
上記の例では400を取得したいと考えています。私は以下を実行していますが、一致しません:
CITYNUMBER=`sed -n -e 's/.*City<\/a>\s<em>(\(.*?\))<\/em>/\1/p' index.html`