私はcURL
このようなウェブサイトからデータを抽出するために使用しています:
function get_data($url)
{
$ch = curl_init();
$timeout = 7;
$userAgent = "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; .NET CLR 1.1.4322)";
curl_setopt($ch, CURLOPT_USERAGENT, $userAgent);
curl_setopt($ch,CURLOPT_URL,$url);
curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);
curl_setopt($ch,CURLOPT_CONNECTTIMEOUT,$timeout);
curl_setopt($ch, CURLOPT_ENCODING, "UTF-8");
$data = curl_exec($ch);
curl_close($ch);
return $data;
}
curl はvnenna
、ブラウザが「vnenna」と表示する正確な文字を「」として返します。
問題は、これらの文字を見つけて、コンテンツを再フォーマットして適切に表示する方法です。