ページ番号を削除する必要がある場所に、次のテキストがあります。
<p class="p3">El gabinete se iba iluminando lentamente ... Por delante de las</p>
<p class="p5"><span class="s4"><i>32</i></span> grandes nubes de un color violeta obscuro...</p>
<p class="p3">
削除する必要があります
</p>
<p class="p5"><span class="s4"><i>32</i></span>
それから。
これまでのところ、私はこれを持っています
sed -E -i '' 's/</p>\n<p class="p[0-9]+"[^>]*><span class=".+">.+<\/span> / /g' Capítulo1.html
しかし、それは機能しません。</p>\n
パーツがなくても機能しますが、キャプチャして置き換える必要があり</p>
ます。
これはMac上であり、sedはLinuxとは少し異なるようです。また、段落クラスは、スパン クラス s の後に番号が続く場合と同様に、p で始まり、その後に番号が続くものにすることができます。イタリック体のタグは存在する場合も存在しない場合もあり、その間にページ番号があります。