次のコンテンツを含むhtmlファイルがあります。sedを使用して、パターン間のすべてのコンテンツ(複数行)を削除し、残り< script ..... >
を</script>
そのままにします。タグも削除したいです。
どんな助けでもいただければ幸いです。ありがとう!私は次の両方を試しましたが、運がありませんでした。
cat test.html | tr -d '\n' | sed 's/< script.*<\/script>//g' > output.txt
と
sed '/< script/,/<\/script>/d' test.html > output.txt
don't touch this.
this is not to be removed < script bla bla> this is to be
removed. < /script> this is going to
stay < script bla bla bla bla bla> remove this
and this
and this < /script> and this stays as is.
this too.