3

私はphpアプリに取り組んでおり、(電子メール、データベースなど)のようなさまざまなソースからランダムなテキストを取得しています。今、問題に直面しています。次のような壊れたHTML要素を含むテキストがあります

$purl  ='FTP details are as 
follow:User name : Mahmud
div>password :1234556Than
ks ';

.strip_tags といくつかの preg マッチング アルゴを試しましたが、うまくいきませんでした。上記のタグのように完全でない場合、HTML 要素を削除するにはどうすればよいdiv>ですか。助けてくれてありがとう。

詳細については、このリンクを追加しています。メールをフェッチしてから、DOM を使用してメールの特定の部分を取得しています。

4

3 に答える 3

1
http://php.net/manual/en/tidy.parsestring.php



<?php
ob_start();
?>

<html>
    <head>
        <title>test</title>
    </head>
    <body>
        <p>error<br>another line</i>
    </body>
</html>

<?php

$buffer = ob_get_clean();
$config = array('indent' => TRUE,
        'output-xhtml' => TRUE,
        'wrap' => 200);

$tidy = tidy_parse_string($buffer, $config, 'UTF8');

$tidy->cleanRepair();
echo $tidy;

?>
于 2013-09-13T09:59:13.487 に答える