0

私はcURLこのようなウェブサイトからデータを抽出するために使用しています:

function get_data($url)
{
$ch = curl_init();
$timeout = 7;
$userAgent = "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; .NET CLR 1.1.4322)";
curl_setopt($ch, CURLOPT_USERAGENT, $userAgent);
curl_setopt($ch,CURLOPT_URL,$url);
curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);
curl_setopt($ch,CURLOPT_CONNECTTIMEOUT,$timeout);
curl_setopt($ch, CURLOPT_ENCODING, "UTF-8");
$data = curl_exec($ch);
curl_close($ch);
return $data;
}

curl はvnenna、ブラウザが「vnenna」と表示する正確な文字を「」として返します。

問題は、これらの文字を見つけて、コンテンツを再フォーマットして適切に表示する方法です。

4

1 に答える 1

3

これはcUrlの問題ではありません。表示されるのは、HTMLエンティティでエンコードされた文字だけです。html_entity_decode()それらをデコードするために使用します。

http://php.net/manual/en/function.html-entity-decode.phpを参照してください

于 2013-01-23T14:46:19.167 に答える