2

一般化された方法で、UNIX シェル スクリプトの td タグ間のデータを取得したいと考えています。

たとえば、次のように

<td style="padding:3px;" align="center">123.456</td>

一般的な方法で 123.456 を取得する方法。

ありがとう

4

4 に答える 4

2

あなたはsedで試すことができます、

sat:~# cat file
<td style="padding:3px;" align="center">123.456</td>
<td>sat</td>
sat:~#  
sat:~# sed 's/<td\(.*[^<>]\+\?>\)\(.*\)<\/td>/\2/g' file
123.456
sat
sat:~# 

お役に立てば幸いです。

于 2013-04-25T11:02:04.620 に答える
0

何らかの理由で xml パーサーを使用できない場合は、

grep は物事を抽出するために生まれました。:)

grep -Po '(?<=>)[^<]*'
于 2013-04-25T11:12:51.797 に答える
0
sed 's/^.*<td.*>\(.*\)<.*$/\1/' file
于 2013-04-25T11:04:09.880 に答える
0

適切な解決策として、一般化された方法でhtml-xml-utils のような適切なパーサーを使用します

不適切で一般化されていない方法については、sed を使用します。

sed 's/^.*>\([0-9.]*\)<.*$/\1/'
于 2013-04-25T11:07:28.440 に答える