1

Curl と simplehtml dom を使用して解析している Web サイトから危険な html 文字をすべて削除する必要があります。

<?php
$html = "this is&nbsp;a text";
var_dump($html);
var_dump(html_entity_decode($html,ENT_COMPAT,"UTF-8"));

どの出力

string(19) "これはテキストです"

string(15) "これは┬áテキストです"

テキストには他の文字 (° など) があるため、preg* は使用したくありません。これは今私を狂わせています!

ありがとう、ジェームズ

4

2 に答える 2

1

それが置き換える必要がある唯一の文字である場合は、単に使用してくださいstr_replace()

var_dump(str_replace('&nbsp;', ' ', "this is&nbsp;a text"));

実際に見る

于 2013-03-07T17:31:43.433 に答える