PHPを使用してPDFファイルに書き込んでいるHTMLデータがたくさんあります。PDF では、すべての HTML を削除してクリーンアップしたいと考えています。たとえば、次のようになります。
<ul>
<li>First list item</li>
<li>Second list item which is quite a bit longer</li>
<li>List item with apostrophe 's 's</li>
</ul>
次のようになる必要があります。
First list item
Second list item which is quite a bit longer
List item with apostrophe 's 's
ただし、単純に を使用するstrip_tags()
と、次のようになります。
First list item

Second list item which is quite a bit
longer

List item with apostrophe ’s ’s
出力のインデントにも注意してください。
HTML を適切にクリーンアップして、乱雑な空白や奇妙な文字のないきれいな文字列にする方法に関するヒントはありますか?
ありがとう :)