0

Linuxサーバー上に1000以上のhtmlファイルがあります。すべて1000行を超えています。
ほとんどのファイルには、削除する必要のあるhtmlコードの特定の部分が含まれています。

私が削除する必要がある部分はこれについて見えます:

<div class="LoginOuterCssClass" id="ctl07">
    ...
</div>

これに対するスクリプトまたはコマンドラインソリューションはありますか?

次のようなコマンドは役に立ちませんでした:

X,Ys/search/replace/g
1,2s/\([a-z]*\), \([a-z]*\)/\2 \1/ig
s/<[^]*>//g

助けていただければ幸いです。

4

1 に答える 1

2

1つのファイルで次のコマンドを試して、目的のsed動作をするかどうかを確認してください。

sed -n '/<div class="LoginOuterCssClass" id="ctl07">/{:a;N;/<\/div>/!ba;N;s/.*\n//};p' file.html

これを複数のファイルで実行してインプレースで編集するには、以下に示すようにファイルを実行してviafindに渡します。sedxargs

find /some/path -name "*.html" -print0 | xargs -0 sed -i -n '/<div class="LoginOuterCssClass" id="ctl07">/{:a;N;/<\/div>/!ba;N;s/.*\n//};p'
于 2012-12-14T15:44:28.213 に答える