php - PHPCurl-返されたhtmlはすべて台無しになりました

Question

Curlを介してWebサイトの記事に関するコンテンツを取得しようとしています。これは、次のように実行しています。

    $url = 'http://lisboacity.olx.pt/oportunidade-pastor-alemao-7-meses-com-lop-iid-432402267';

    $ch = curl_init();
    curl_setopt($ch, CURLOPT_URL, $url);
    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
    curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10);
    curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; .NET CLR 1.1.4322');
    curl_setopt($ch, CURLOPT_FAILONERROR, true);
    curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);
    curl_setopt($ch, CURLOPT_AUTOREFERER, true);
    curl_setopt($ch, CURLOPT_TIMEOUT, 10);
    $data = curl_exec($ch);
    curl_close($ch);
    echo $data;

ただし、ご覧のとおり、結果は次のようになります。

‹ÜW_oÛ6N€~F{hD’å?±“ØÜÄm‚&amp;qZ;-Ö¢0h‰–™R¢JR¶ÓapcèÃ°}*ö²§)%Vœ&YÚ·†eêî~¿;òx<6×ö{{ƒ_N»èp|„NÏžî!ËvÝ×•=×Ýìg‚ªSòÐ@àXREyŒ™ëvO,dM”Jv\w6›9³ŠÃEè^º±ªË8—Ä TµW›ú•~À#" #mj“)¶¬=++{p‘ùÙ¨e)2Wmù,$QÃ~Ïn4jÛ¶g!÷.¨#‡)‹p‰26«>Í–M·.ƒTŽ8ö©ºp8›;‰r-¤°ÕJÂÆ£¢Š‘v/áB¥1 p@ÖN±T\ #Ñ'Žê("’H ŽÐQïÔ…#ƒ:10•(à £¨Ï%¼D]øá??ñ¦›d‘Å8"-+ Ò4Ñ3_ç:åÓÏÁ†ð’\[‘8]ÿÑëÎà zÕ;AOûý½ƒÞÓþA÷ðxíÑê£Uã»ôvS_pB“M ’aÙq€AŠX"øNa¦bx’;hŸÊäoCÃ0þjB3C@ Rå"™0Ãz€cž&ü{æäjúô '&äö'¤åUªõZ½î5êÀd2Ñø=„µ,Ç<†bÛìž3èGöØj±Ð{9Ø; Ã½ÞÉ«,Æ]©.‘îO!Åb~–Á2 !°'uåÊj_Êÿ„œ=†žç;Æ$"Ó-3–

DomDocumentPHPのクラスでURLコンテンツをロードしようとしましたが、同じ結果になりました。

これを引き起こしている可能性がありますか？前もって感謝します！

score 8 · Accepted Answer

出力はgzipでエンコードされます。コンテンツを解凍するには、次のオプションを試してください。

curl_setopt（$ ch、CURLOPT_ENCODING、''）;

CURLOPT_ENCODING：「Accept-Encoding：」ヘッダーの内容。これにより、応答のデコードが可能になります。サポートされているエンコーディングは、「identity」、「deflate」、および「gzip」です。空の文字列""が設定されている場合、サポートされているすべてのエンコーディングタイプを含むヘッダーが送信されます。

http://us2.php.net/curl_setoptから

php - PHPCurl-返されたhtmlはすべて台無しになりました

1 に答える 1

Related

Reference