一般化された方法で、UNIX シェル スクリプトの td タグ間のデータを取得したいと考えています。
たとえば、次のように
<td style="padding:3px;" align="center">123.456</td>
一般的な方法で 123.456 を取得する方法。
ありがとう
あなたはsedで試すことができます、
sat:~# cat file
<td style="padding:3px;" align="center">123.456</td>
<td>sat</td>
sat:~#
sat:~# sed 's/<td\(.*[^<>]\+\?>\)\(.*\)<\/td>/\2/g' file
123.456
sat
sat:~#
お役に立てば幸いです。
何らかの理由で xml パーサーを使用できない場合は、
grep は物事を抽出するために生まれました。:)
grep -Po '(?<=>)[^<]*'
sed 's/^.*<td.*>\(.*\)<.*$/\1/' file
適切な解決策として、一般化された方法でhtml-xml-utils のような適切なパーサーを使用します
不適切で一般化されていない方法については、sed を使用します。
sed 's/^.*>\([0-9.]*\)<.*$/\1/'