いくつかのhtmlファイルがあり、これらのタグを含む行のみを抽出したい:
head
p
次のように、sedを使用してファイルのこれらの部分を抽出しました。
grep "<head>" myfile.html | sed -e 's%\(head\)\(.*\)\(/head\)%title\2\/title%'
grep "<p>" myfile.html | sed -e 's%\(<p>\)\(.*\)\(</p\)\(>\)%\2\\%'
すべて問題ありませんが、各行の最後に「\」の文字が表示されます。この問題をどのように克服できますか?