正規表現を使用せずに、有効な HTML マークアップ (コメントを含む) ではないすべてのものを変数から削除することは可能ですか?
$var = "<html>" .
"<head>" .
"<script src="something"></script>" .
"<script>document.write('Hello');</script>" .
"<p>Some text</p>" .
"<!-- Comment -->" .
"Random text not in any markup." .
"</html>";
処理後に $var に含める必要があります。
<html>
<head>
<script src="something"></script>
<script>document.write('Hello');</script>
<p>Some text</p>
</html>