0

HTML ファイルから多数の文字列を抽出するスクリプトを実行し、すべてを新しいファイルにインポートしたいと考えています。より具体的には、 all<td></td>ペアの間の文字列を調べて、それらの間の文字列が length の場合は、文字列kを抽出します。

4

1 に答える 1

1

awkxml を解析するための適切なツールではありませんが、この単純なケースでは次の方法で十分です。

awk '/<\/$/ && length == k + 2' RS='td>' k=$K input

これにより、各文字列と末尾の</. これはハックであり、信頼できる堅牢なソリューションとして扱うべきではありません。

于 2012-09-18T17:56:25.810 に答える