HTML の Web をクロールしています。php strip_tags を使用すると、HTML 全体が 1 行にまとめられ、すべての構造が削除されます。
h、p、および br の終了タグを改行に置き換えて、構造を保持したいと思います。
プレグの交換がこれに対する最良の解決策でしょうか?
すべての終了タグを置き換えたら、ストリップ タグを実行しますが、この方法で基本的な構造が得られます。
HTML の Web をクロールしています。php strip_tags を使用すると、HTML 全体が 1 行にまとめられ、すべての構造が削除されます。
h、p、および br の終了タグを改行に置き換えて、構造を保持したいと思います。
プレグの交換がこれに対する最良の解決策でしょうか?
すべての終了タグを置き換えたら、ストリップ タグを実行しますが、この方法で基本的な構造が得られます。
$str = 'some html';
$tags = array('</p>','<br />','<br>','<hr />','<hr>','</h1>','</h2>','</h3>','</h4>','</h5>','</h6>');
$str = str_replace($tags,"\n",$str);
// then strip tags
構造を取り戻すために、きちんとした後書きを実行してみませんか?